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普林斯顿 大 学 数学 硕士 及 博士 。 现 
任 威廉 姆 斯 学 院 数学 教授 、Erdés 
研究 所 教 职 研究 员 ， 还 是 美国 数学 
协会 和 Phi Beta Kappa 荣誉 学 会 
成 员 。 主 要 研究 方向 有 数论 、 线 性 
代数 、 概 率 论 和 统计 学 。 
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内 容 提 要 

本 书 讲解 概率 论 的 基础 内 容 ,包括 组 合 分 析 、 概 率 论 公理 、 条 件 概率 、 离 散 型 随机 变量 、 
连续 型 随机 变量 、 随 机 变量 的 联合 分 布 、 期 望 的 性 质 、 极 限定 理 和 模拟 等 ， 内 容 丰 富 ， 通 俗 
易 懂 ， 并 配 有 丰富 的 例子 和 大 量 习题 ， 涉 及 物理 学 、 生 物 学 、 化 学 、 遗 传 学 、 博 弈 论 、 经 济 
学 等 多 方面 的 应 用 ， 极 具 启 发 性 . 
本 书 适合 数学 专业 、 各 理工 科 专 业 本 科 生 阅读 ,也 可 供 工 程 师 和 经 济 学 家 等 人 十 参考 . 本 

书 既 可 作为 教材 、 习 题 集 ， 也 可 作为 学 习 指南 ， 同 时 还 有 利于 教师 备课 
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欢迎 阅读 本 书 . 我 的 目标 是 让 学 生 通 过 大 量 现 有 的 例子 和 已 经 实现 的 代码 来 党 


握 书 中 的 内 容 . 另外 , 本 书 


写 给 读者 的 话 


不 仅 要 引导 学 生 对 方程 和 定理 为 什么 成 立 展开 大 量 讨论 ， 


还 要 引导 他 们 不 断 探 讨 为 什么 这 些 方程 和 定理 具有 这 样 的 形式 . 从 某 种 意义 上 说 ， 
本 书 是 阿 德里 安 。 班 纳 的 成 功 著作 《普林斯顿 微 积分 读本 》 的 续 作 . 除了 那些 已 有 


答案 的 问题 之 外 , 关于 定理 的 证 明 , 书 中 给 出 了 很 多 解释 说 明 , 其 中 重点 讨论 了 为 


什么 某 些 论证 是 显然 成 立 


的 ,以 及 我 们 为 什么 想 要 得 到 具有 某 种 特定 形式 的 答案 . 


弄 清楚 某 些 结论 为 何 成 立 以 及 应 当 采 用 什么 样 的 思路 来 证 明 , 将 帮助 你 更 加 正确 地 
使 用 这 些 结论 并 从 中 挖掘 出 新 的 相关 知识 .本 书 着 重 强调 了 证 明 背 后 的 方法 和 技 


巧 , 因为 这 些 方法 和 技巧 的 应 用 领域 不 仅 限于 概率 论 这 一 门 课程 . 例如 , 附录 A "中 
有 关于 证 明 技 巧 的 扩展 条 目 , 17.1 节 中 有 对 马尔 可 夫 不 等 式 的 讨论 . 另外 , 本 书 利 


用 了 大 量 的 计算 机 代码 示例 来 探讨 概率 问题 . 现在 已 是 21 世纪 了 , 如 果 不 会 编写 


简单 的 代码 , 那么 你 在 竞 久 


中 就 会 处 于 劣势 ， 当 我 们 得 到 闭 型 解 时 , 编写 小 程序 将 


有 助 于 检验 其 数学 算法 是 


否 正 确 ; 更 重要 的 是 , 如 果 问 题 分 析 起 来 相当 复杂 , 而 我 


们 又 很 难得 出 精确 答案 , 那么 编写 小 程序 将 有 助 于 估算 出 答案 . (如 果 可 能 的 话 ! ) 


本 书 既 可 以 作为 经 : 


概率 论 图 书 的 补充 , 也 可 以 作为 学 习 概 率 论 的 主要 教材 ， 


共 分 为 五 个 部 分 . 第 一 部 分 介绍 概率 论 , 由 六 章 组 成 . 第 1 章 主要 通过 一 些 有 趣 的 


问题 来 引入 许多 重要 思想 , 概率 论 中 的 很 多 核心 理念 将 会 反复 出 现 . 第 2 章 会 给 出 


概率 论 中 的 基本 定律 , 相应 的 例子 会 在 第 3 章 中 给 出 . 这 样 的 安排 能 使 学 生 迅 速 接 
触 到 概率 论 中 的 实际 问题 , 并 且 不 会 在 理论 知识 增长 的 同时 感到 压力 倍增 . 在 研究 


完 这 些 例 子 之 后 , 第 4 章 仍然 是 理论 知识 , 其 后 两 章 仍 与 例子 有 关 (当然 , 这 两 章 还 


将 引入 解决 这 些 问 题 的 若 


技巧 , 然后 通过 “标准 化 ” 


第 三 部 分 研究 的 是 


干 理论 ). 


第 二 部 分 是 大 多 数 课 程 的 核心 , 引入 了 随机 变量 . 首先 , 它 回顾 了 一 些 有 用 的 


技巧 来 研究 随机 变量 . 


些 特殊 分 布 . 概率 分 布 有 很 多 类 型 , 但 这 一 部 分 有 所 选择 ， 


并 且 很 好 地 将 连续 分 布 和 
对 你 所 见 到 的 任何 新 分 布 


离散 分 布 结合 了 起 来 . 在 读 完 这 几 章 之 后 , 你 就 有 能 力 应 
了 . 


@ 附录 请 到 图 灵 社区 本 书 主 


第 四 部 分 研究 的 是 收敛 定理 ,由 于 这 部 分 内 容 则 在 作为 补充 材料 或 入 门 课程 ， 
因此 不 做 特别 详细 的 讨论 ， 


但 我 们 会 证 明 马 尔 可 夫 不 等 式 、 切 比 雪夫 定理 、 弱 大 数 


页 (ituring.cn/book/1996) 下 载 . 一 一 编者 注 


iv ” 写 给 读者 的 话 


定律 和 强大 数 定律 、 斯 特 林 公式 以 及 中 心 极限 定型 
因此 我 们 会 在 这 部 分 和 相关 附录 中 进行 详细 


E (CLT). 最 后 这 个 定理 特别 重要 ， 


论述 , 而 这 里 所 使 用 的 技巧 本 身 就 具有 


定 的 研究 价值 . 想 了 解 关 于 这 些 价值 的 更 多 内 容 , 可 以 查阅 网 络 资源 (其 中 有 一 
章 关 于 复 分 析 和 CLT 的 高 阶 内 容 ). 
为 了 让 学 生 和 教师 更 灵活 地 掌握 教材 内 容 , 最 后 的 第 五 部 分 将 会 安排 各 类 相关 
知识 . 由 于 很 多 课程 会 把 概率 论 与 统计 学 结合 在 
检验 这 一 章 . 接 下 来 , 我 们 会 考察 差分 方程 , 这 部 分 内 容 延 续 了 第 1 章 的 主题 思想 . 


我 真 的 非常 喜欢 最 小 二 乘法 , 虽 


起 , 因此 我 们 首先 要 看 的 是 假设 


然 它 是 统计 学 的 内 容 , 但 也 是 对 线性 代数 和 多 元 微 
积分 的 完美 应 用 . 另外 , 如 果 让 误差 服从 独立 的 高 斯 分 布 , 那么 我 们 就 能 得 到 一 个 
卡 方 分 布 , 这 使 得 最 小 二 乘法 在 概率 论 中 也 有 了 完美 的 拟 合 . 我 们 还 会 谈 到 一 些 著 


名 问题 , 并 给 出 关于 编程 的 入 门 指南 (对 编程 更 全 面 的 介绍 , 请 参阅 网 络 补充 资料 ). 
在 21 世纪 , 你 必须 具有 基本 的 编程 能 力 ， 首 先 , 这 是 检验 你 的 答案 正确 与 否 以 及 


或 许 就 能 帮助 你 猜测 出 正确 


~ 


帮助 你 查 缺 补漏 的 好 方法 . 其 次 , 倘若 你 会 编程 , 那么 你 对 答案 就 有 了 初步 感受 , 这 
的 答案 . 最 后 , 尽管 在 很 多 时 候 并 不 存在 简单 的 闭 型 解 ， 
且 我 们 可 以 在 没有 其 他 选择 的 情况 下 利用 模拟 来 估算 概率 . 这 就 很 好 地 呼应 了 本 段 


开头 所 说 的 假设 检验 : 如 果 我 们 推测 出 了 一 个 答案 , 那么 能 否 通 过 模拟 加 以 证 实 ? 
分 析 模 拟 和 数据 是 现代 科学 的 核心 , 我 也 强烈 建议 你 继续 学 习 一 门 统计 学 课程 (多 


门 更 好 ). 


本 书 最 后 给 


了 大 量 附录 ", 这 些 内 容 都 是 经 过 精心 安排 的 . 很 多 人 在 学 习 概 


给 出 
率 论 的 过 程 中 苦 苦 挣扎 , 而 问题 往往 出 现在 他 们 以 前 学 过 的 知识 和 技巧 上 , 尤其 是 


定理 的 证 明 方 面 . 这 也 是 为 什么 第 一 个 有 关 证 明 技 巧 的 附录 会 如 此 宛 长 而 详细 . 第 
二 个 附录 快速 回顾 了 那些 会 被 用 到 的 分 析 结 果 , 接 下 来 的 附录 则 与 可 数 集 与 不 可 数 
集 有 关 . 数学 中 最 大 的 困难 往往 出 现在 与 无 穷 大 有 关 的 问题 上 , 安排 这 部 分 内 容 就 


是 为 了 简单 地 介绍 出 现在 概率 论 中 的 无 穷 大 . 最 后 的 附录 简要 地 谈 了 谈 复 分 析 是 如 


何在 概率 论 中 起 作用 的 , 尤其 是 在 如 何 严 格 地 证 明 中 心 极限 定理 方面 . 虽然 该 附录 


涉及 高 等 知识 , 但 值得 花 时 间 学 习 , 因为 掌握 这 部 分 内 容 既 可 以 让 你 更 好 地 学 习 后 
尔 领悟 这 门 学 科 的 美妙 与 复杂 之 处 . 


我 希望 把 更 多 的 知 计 


在 网 上 免费 获取 额外 的 知 
面 , 它 提供 了 大 量 资料 , 我 以 前 的 所 有 课 


也 都 包含 其 中 . 


! 写 进 书 里 , 但 本 书 的 内 容 已 经 够 多 了 . 不 过 , 好 在 你 可 以 


识 , 希望 你 能 认真 地 研读 . 请 访问 普林斯顿 出 版 社 本 书页 
程 (全 部 的 上 课 视 频 以 及 每 天 的 补充 说 明 ) 


我 们 回 过 头 来 看 一 下 补充 内 容 . 首先 是 一 系列 微 积 分 问题 的 求解 练习 . 求解 这 


样 的 问题 可 以 很 好 地 检验 你 对 所 需 知识 的 了 解 程度 . 上 


@ 附录 请 到 图 灵 社区 本 书 了 


E 页 (ituring.cn/book/1996) 下 载 . 一 一 编者 注 


请 然 有 些 内 容 涉及 高 等 知识 并 


写 给 读者 的 话 v 


超出 了 许多 经 典 入 门 课 的 范围 , 但 是 很 容易 理解 , 因此 也 是 很 不 错 的 补充 材料 接 
来 谈 到 的 是 变量 代 换 公式 . 由 于 很 多 学 生 把 多 元 微 积 分 的 内 容 忘 记得 差不多 了 ， 
因此 轻松 地 在 网 上 查阅 到 这 些 知 识 具有 很 大 意义 . 随后 是 最 长 游程 的 分 布 . 我 一 直 
都 很 喜欢 这 个 课题 , 它 阐述 了 许多 非常 有 用 的 技巧 . 下 一 个 要 说 的 是 中 值 定 理 . 虽 
然 中 心 极限 定理 本 该 是 这 门 课程 的 核心 内 容 , 但 由 于 在 某 些 情况 下 它 的 条 件 无 法 满 
足 , 因此 中 值 定理 就 成 了 一 个 很 重要 的 知识 点 .最 后 就 要 讲 一 下 中 心 极限 定理 了 . 
在 入 门 课程 里 , 我 们 只 证 明 该 定理 的 几 种 特殊 情形 , 这 样 就 引出 一 个 问题 : 完整 证 
明 需 要 什么 条 件 ? 我 们 的 目的 是 让 你 了 解 一 些 复 分 析 的 知识 , 而 复 分 析 本 身 就 是 十 
分 美妙 的 ; 同时 还 希望 你 能 对 证 明 有 一 定 的 认识 , 并 在 数学 之 旅 中 继续 前 进 下 去 . 
阅读 愉快 ! 


如 何 使 用 本 书 


本 书 可 以 帮助 你 学 习 和 探索 概率 论 . 它 既 可 以 作为 任何 一 本 概率 论 入 门 读物 


的 补充 材料 , 又 可 以 单独 作为 基础 


后 议 
果 需 要 


如 


i 


已 


发 现 许 多 奇怪 的 关联 和 貌 


会 变 得 简单 起 来 . 让 人 恺 惧 的 是 , 它 所 包含 
我 助 你 尽情 地 畅游 于 这 片 撩 
备 . 本 


上 | 


的 目标 是 


有 大 量 的 应 用 、 技 巧 和 方法 . 这 会 让 人 感到 既 兴 


教材 来 使 用 (对 于 那些 想 把 本 书 当 作 教材 的 教师 
习题 和 考试 中 的 部 分 关键 解答 , i 
最 后 ) 正如 你 在 学 习 过 程 中 


青 发 电子 邮件 给 我 , 地 址 在 这 部 分 内 容 的 
各 会 看 到 的 那样 , 概率 论 是 一 门 涉 及 面 非常 广 的 学 科 
又 恐惧 . 让 人 兴奋 的 是 , 你 会 


的 呈现 方式 深 受 阿 德里 安 


的 内 容 实 在 
1 识 的 海 注 
班 纳 的 成 功 著 作 《 普 林 斯 顿 微 积 


TT 


似 困难 的 问题 , 但 是 只 要 按照 正确 的 思路 去 考察 它们 , 就 


是 太 多 了 . 
中 , 并 为 下 一 步 学 习 做 好 准 


分 读本 》 的 影 


响 . 就 像 那 本 书 一 样 , 本 书 的 目的 是 以 轻松 通俗 的 方式 , 通过 大 量 已 有 答案 的 问题 
来 传授 知识 和 数学 思想 . 在 了 解 标 准 陈 述 和 证 明 的 同时 , 你 还 将 看 到 很 多 现成 的 例 


子 以 及 关于 如 何 研究 定理 的 大 
解 问题 是 这 门 课 的 一 个 习 


删除 ; 


的 例子 . 数学 家 会 利 


三 


讨论 . 学 习 


里 


然而 这 并 不 意味 着 


证 明 过 程 . 
为 什么 证 明 如 此 重要 ? 在 本 书 中 , 我 们 将 会 看 到 一 些 叙述 合理 却 被 证 


用 语言 和 训 


独立 地 写 出 完整 的 证 明 ， 


将 花费 大 量 时 间 来 讨 
诉 我 人 


下 面 是 关于 本 
。 在 阅读 本 书 之 前 , 我 需要 


但 能 实现 这 个 目标 


论 昌 


的 证 明 ， 


上 以 及 如 何 


孚 ,而 非 另 外 一 种 . 


哪些 预备 知识 ? 


学 前 知识 , 并 能 自 


如 地 应 


用 它们 


明 ， 
通过 强调 这 些 理念 , 希望 你 能 更 
做 好 准备 , 还 希望 你 能 在 将 来 


门 课程 的 最 好 方法 就 是 亲手 实践 . 求 
EE 要 部 分 , 但 遗憾 的 是 这 部 分 内 容 通 常会 
学 好 这 门 课 仅仅 是 求解 出 问题 的 答案 ， 


因为 课时 有 限 而 被 
它 还 要 求 我 们 理解 


[一 
wy 


明 是 错误 


E 明 的 形式 化 来 防止 这 些 错 误 出 现 . 此 外 , 即使 课程 
不 要 求 你 掌握 证 明 , 了 解 某 些 命题 为 何 成 立 也 是 很 有 意义 的 . 虽然 并 不 要 求 
也 是 很 不 错 的 . 为 了 
论 为 什么 要 按照 某 种 思路 去 证 
] 应 当 采 用 何 种 方法 来 求 
深刻 地 感知 定理 为 什么 成 立 , 并 为 更 好 地 使 用 它们 
学 习 中 独立 完成 对 结 


尔 最 终 
帮助 你 学 习 , 我 们 
的 哪些 线索 会 告 


以 及 题目 中 


的 


使 用 它 的 一 些 常见 问题 和 解答 
你 应 当 熟 知 代数 学 以 及 微 积 分 的 
. 与 其 姊妹 篇 《普林斯顿 微 积分 读本 》 不 同 ， 


本 书 想 要 补充 的 
程 不 涉及 任 


之 上 , 又 或 者 是 


(或 者 说 本 书 打算 讲 的 ) 内 容 会 更 加 多 样 化 . 有 些 概率 论 课 
可 微 积 分 知识 , 但 其 他 一 些 课程 建立 


在 实 分 析 和 测度 论 的 基础 


此 六 


概率 


半 统 计 的 课程 . 我 们 已 经 试 着 
分 知识 的 需求 , 尤其 是 在 那些 介绍 性 章节 中 . 但 这 并 不 表示 这 些 章节 会 


尽 可 能 减少 对 微 积 
加 


如 何 使 用 本 书 vii 


简单 远 非 如 此 ! 求 积分 通常 比 找 一 个 “正确 的 ”方法 来 考察 组 合 概率 
问题 简单 很 多 . 当 我 们 学 到 连续 分 布 时 , 微 积分 就 成 了 一 个 必 不 可 少 的 内 容 ， 
因为 根据 微 积 分 基本 定理 , 我 们 可 以 利用 不 定 积分 来 计算 面积 , 而 我 们 也 将 
看 到 这 些 面积 通常 对 应 于 概率 . 事实 上 , 求 积 分 比 求 和 “更 容易 ”. 因此 , 正 
是 因为 使 用 了 微 积分 , 连续 型 概率 研究 起 来 才 会 比 离散 型 概率 更 加 容易 . 在 
大 多 数 情况 下 , 我 们 会 避免 涉及 高 等 实 分 析 的 内 容 , 但 在 开头 部 分 会 介绍 如 
何 为 学 好 这 门 课程 打下 坚实 的 基础 , 并 在 最 后 引入 有 关 高 阶 内 容 的 章节 . 
本 书 篇 幅 为 何如 此 之 长 ? 与 作者 相 比 , 教师 有 一 个 巨大 的 优势 : 他 们 可 以 
与 学 生 互动 . 当 教学 中 出 现 难 点 时 , 教师 可 以 放 慢 课程 的 进度 ; 另外 , 他 们 还 
能 根据 每 学 年 学 生 的 不 同 兴趣 来 补充 相应 的 知识 . 但 作者 只 能 求助 于 一 样 
东西 : 内 容 的 长 度 ! 这 意味 着 我 们 将 会 对 某 些 内 容 做 出 更 多 的 解释 , 而 不 仅 
仅 是 你 所 需要 的 那些 . 此 外 , 由 于 很 多 读者 都 不 按照 顺序 来 阅读 本 书 (关于 
这 一 点 稍 后 再 说 ), 因此 本 书 也 将 不 断 地 对 这 些 解 释 进 行 重 述 . 可 期 待 的 是 ， 
无 论 在 书 中 还 是 在 网 络 资源 中 , 我 们 都 将 对 所 有 让 你 感到 困惑 的 概念 进行 
深入 讨论 , 并 补充 大 量 有 趣 的 课题 供 你 探索 . 
本 书 的 内 容 安排 与 课堂 所 学 不 一 致 ! 我 该 怎么 办 ? ”我 的 老师 塞 尔 日 ” 兰 教 
授 曾 经 说 过 , 如 果 一 本 书 必 须 按 照 页 码 顺序 来 阅读 , 那么 这 将 是 一 件 令 人 遗 
憾 的 事 ， 讲 授 概率 论 这 门 课 的 方法 有 很 多 , 而 且 还 有 大 量 的 课题 供 教师 选 
择 . 你 可 能 并 没有 意识 到 这 样 一 件 事 : 由 于 一 学 期 的 时 间 只 有 那么 多 , 因此 
当 你 的 老师 选择 一 个 课题 来 讲 时 , 他 通常 会 忽略 其 他 一 些 课题 . 于 是 , 尽管 
很 多 学 校 都 会 采用 大 量 相同 的 教材 , 但 教授 在 课 上 补充 的 内 容 、 使 用 的 方法 
以 及 在 何 时 引入 某 些 特定 的 课题 都 具有 很 大 灵活 性 . 为 了 帮助 读者 更 好 地 
学 习 , 我 们 会 不 时 地 回顾 书 中 的 内 容 , 这 样 就 能 使 不 同 的 章节 尽量 保持 各 自 
的 独立 性 . (你 可 能 会 留意 到 , 我 们 说 的 这 件 事 回答 了 前 面 的 那个 问题 ! ) 你 
可 以 在 任何 地 方 跳 跃 式 阅读 , 还 可 以 在 需要 的 时 候 通过 查阅 前 面 的 章节 和 
附录 来 了 解 相 关 的 背景 知识 . 
是 否 真 的 有 必要 知道 证 明 方法 ? ”简单 地 回答 : 是 的 . 证 明 很 重要 . 我 之 所 
以 研究 数学 , 一 个 原因 就 是 我 十 分 讨厌 “因为 我 告诉 过 你 就 是 这 样 ” 的 说 法 . 
教授 之 所 以 是 正确 的 并 不 是 因为 他 们 的 身份 是 教授 (而 我 是 对 的 也 并 不 是 
因为 本 书 已 经 出 版 ), 每 一 件 事 都 必须 遵循 合理 的 逻辑 链 ， 当 你 能 熟练 地 把 
握 结论 成 立 的 必要 条 件 时 , 了 解 这 些 结论 为 什么 正确 将 有 助 于 你 理解 教材 并 
看 出 其 中 的 关联 , 还 有 望 确保 你 绝 不 会 使 用 不 恰当 的 结果 . 通过 给 出 完整 、 
严格 的 论述 , 我 们 试 着 尽量 降低 可 能 做 出 错误 假设 的 风险 . 概率 论 中 产生 了 
量 合乎 情理 且 看 起 来 条 理 清晰 的 命题 , 但 它们 最 终 被 证 明 是 不 成 立 的 , 而 
严格 性 是 我 们 避免 发 生 这 种 错误 的 最 佳 防御 手段 . 遗憾 的 是 , 随 着 学 期 进度 


一 二 


Viii 


如 何 使 用 本 书 


的 
应 用 ， 


但 因 


型 做 法 就 


论 还 是 对 


是 只 对 复 分 析 
某 些 特殊 情形 的 分 析 , 我 


E 进 , 对 结论 的 证 明 会 变 得 越 来 越 允 


此 言 - 乡 


二 | 可 


常 的 课程 会 涉及 


以 实现 . 通 


现在 对 中 ， 


为 时 间 有 限 , 我 们 不 可 能 把 用 到 的 所 有 


率 论 中 最 常见 的 一 个 例子 


背景 知识 都 证 明 一 遍 . 概 
证 明 的 讨论 中 , 这 里 的 典 


极限 定理 


感知 为 什么 这 就 是 了 


的 一 些 结果 进行 简单 的 陈述 . 不 管 是 非 正式 的 讨 


门将 始终 图 明 需 要 的 是 什么 , 并 试 着 让 你 


E 确 的 . 最 后 , 我 们 还 会 给 出 相应 的 参考 文献 . 


为 什么 有 了 时候 使 用 “我 们 ”, 但 有 时 又 使 用 “我 ”? 观察 力 不 错 . 按照 数学 


本 书 的 一 部 分 


中 的 习惯 用 法 , 本 书 应 该 
缺乏 亲切 感 ; 当 需 要 注入 更 多 亲切 感 时 , 书 中 就 会 改 用 
内 容 是 我 与 诸多 学 生 历 经 多 年 共同 完成 的 . 这 样 笋 费 苦 心 的 


直 使 用 


“我 们 ”, 但 这 种 用 法 有 时 会 过 于 正式 且 
“我 ”. 更 重要 的 是 ， 


安排 有 很 多 原 


基 


. 一 方 二 


, 这 对 了 


量 


我 的 学 生来 说 是 


次 很 好 的 体验 ; 


面 , 这 还 能 保证 本 书 的 确 是 针对 学 生 而 写 的 . 接 下 来 将 会 继续 混合 使 用 “我 


们 ”和 “我 ”. “我 们 ”这 个 词 挺 不 错 的 , 使 
们 来 共同 学 习 本 书 ! 希望 你 能 
本 书 可 以 作为 学 校 教材 来 使 用 吗 ? 绝对 可 以 ! 为 了 进一步 巩 


章 的 最 后 都 给 出 了 很 多 习题 , 而 这 些 习 


消除 选 词 所 造成 的 困惑 ! 


日 它 可 以 让 你 融入 教材 中 . 让 我 


回 知识 , 每 一 


题 是 最 适合 当家 庭 作 业 的 . 教师 可 以 


发 电子 邮件 到 Steven.Miller.MC.96Q@aya.yale.edu 或 者 sjml@williams.edu 来 
获取 更 多 的 题目 、 试卷 以 及 相关 解答 . 


书 中 用 到 的 一 些 方法 与 我 所 学 的 不 一 样 . 那么 谁 才 是 正确 的 呢 


还 是 本 书 作者 ? 实际 上 老师 和 我 都 是 正确 的 ! 如 果 有 疑问 , 你 可 以 去 问 一 


头 


下 老师 或 者 发 电子 邮件 给 我 


天 啊 ! 本 书 的 内 容 实 在 太 多 了 
的 一 次 复习 课 


位 学 


上 , 我 记得 有 


如 


期 的 时 间 来 阅读 这 本 书 , 因 
本 书 的 主页 上 列 出 了 一 个 文档 ， 


果 你 觉得 某 些 特定 概念 3 
理解 它们 的 那 部 分 内 容 是 一 个 不 错 


储 以 到 


LE 解 ， 那 么 集中 精力 去 寻找 书 中 最 有 助 于 你 


老师 


我 该 如 何 使 用 它 昵 ? 在 普林斯顿 大 学 
生 对 数学 书 有 索引 这 件 事 感到 非常 惊讶 ; 


的 办 法 . 也 就 是 说 , 我 们 的 目标 是 用 一 学 


此 


总 


人 心 \ 


思想 , 并 给 出 了 不 同 难 
前 预习 要 学 的 知识 . 我 发 现在 课堂 上 实时 消 
果 能 在 上 课 之 前 对 那些 定义 条 
就 变 得 容易 多 了 . 为 此 , 我 们 给 
讲 的 是 什么 . 该 表 的 


LE 度 的 


题 


尔 不 加 
妇 


二 


目 . 我 始终 坚信 应 该 在 上 课 : 


I 主要 


] 着 急 . 为 了 提高 你 的 阅读 效率 , 我 们 在 
了 书 中 的 要 点 、 术 语 以 及 每 一 节 的 中 心 
前 做 好 准备 , 提 
化 新 的 数学 知识 非常 困难 , 但 如 
思想 有 一 个 基本 了 解 , 那么 消化 新 知识 


出 一 个 线 上 汇总 表 , 它 重点 强调 了 每 一 节 要 
目的 是 为 你 研究 每 一 个 课题 做 好 准备 ， 


并 对 你 的 学 习 效 


果 给 出 快速 测评 . 你 可 以 在 图 灵 社 
总 表 . 


为 了 帮助 你 学 好 本 


,我 们 把 重要 的 公式 和 定理 都 框 了 起 来 一 一 这 强 


区 本 书 主页 的 “ 随 书 下 载 ”处 找到 线 上 汇 


如 何 使 用 本 书 ”这 


烈 地 表明 该 结论 十 分 重要 , 你 应 当 掌握 好 它 ! 有 一 些 学 校 允许 学 生 在 考试 时 


况 下 , 做 好 总 结 就 足以 巩 
做 好 笔记 , 随时 记录 下 你 


及 强调 了 每 节 要 点 的 网 络 文档 中 查看 相关 内 容 . 


携带 一 两 页 笔记 , 但 即使 你 的 学 校 不 允许 这 样 做 , 准备 好 这 样 的 总 结 也 是 很 
不 错 的 . 我 认为 做 好 笔记 将 有 助 于 学 生 更 好 地 学 习 知 识 . 
数学 与 记忆 无 关 , 但 有 一 些 重 要 的 公式 和 技巧 需要 你 熟练 掌握 . 通常 情 


固 好 你 所 学 的 知识 了 . 在 阅读 每 一 章 的 时 候 你 都 要 
发 现 的 重要 知识 点 , 然后 在 这 一 章 最 后 的 总 结 里 以 


试 着 去 找 一 些 类 似 的 考试 题 , 比如 学 校 前 几 年 的 期 末 考 试题 , 并 在 特定 
条 件 下 完成 它们 . 这 意味 着 在 此 过 程 中 , 你 不 能 休息 、 不 准 吃食 物 、 没 有 课 


本 、 不 能 打 电 话 、 无 法 发 
否 抓 住 解 题 的 关键 并 对 试卷 进行 评分 , 或 者 让 其 他 人 (非常 好 ! ) 来 为 你 打 


郧 件 , 也 不 可 以 收发 消息 , 等 等 . 然后 , 看 看 自己 能 


分 .另外 一 种 很 棒 的 方法 是 写 一 些 练习 测验 的 题目 ,然后 与 朋友 交换 着 做 . 


我 党 发 现 这 样 一 种 状况 : 


当 我 参加 了 一 两 次 某 教授 组 织 的 考试 后 , 就 对 该 教 


授 的 出 题 偏好 有 了 一 定 的 了 解 , 并 且 时 常 猜 出 一 些 考试 题目 . 尝试 着 做 每 章 
最 后 的 练习 题 , 或 者 从 图 书馆 中 另 借 一 本 书 并 试 着 求解 那些 已 经 给 出 答案 
的 题目 . 你 练习 的 题目 越 多 , 就 会 做 得 越 好 . 对 于 定理 , 删除 其 中 一 个 条 件 并 
观察 会 有 什么 样 的 状况 发 生 . 一 般 情况 下 , 定理 不 再 成 立 , 因此 你 可 以 找 一 
个 反例 (有 时 候 定理 仍然 成 立 , 此 时 的 证 明 将 会 更 加 困难 ). 每 当 你 得 到 一 个 
条 件 时 , 该 条 件 就 应 当 在 证 明 中 有 所 体现 对 于 每 一 个 结果 , 试 着 看 
下 上 述 情况 会 在 哪里 发 生 . 


有 没有 能 帮助 学 习 的 视频 资料 ? 我 已 经 在 布朗 大 学 、 曼 荷 莲 学 院 以 及 威廉 
姆 斯 学 院 讲 过 很 多 遍 这 门 课 . 最 后 儿 次 在 威廉 姆 斯 学 院 的 上 课 过 程 被 我 录 
制 下 来 并 放 在 了 YouTube 上 , 可 以 查询 我 的 主页 得 到 其 链接 . 此 外 , 你 还 能 


姆 斯 学 院 的 课程 主页 , 其 


在 我 的 主页 上 找到 大 量 补充 资料 , 比如 讲义 和 教材 注解 等 . 请 访问 我 在 威廉 


门 课 我 已 经 讲 过 很 多 遍 了 , 因此 课 启 上 的 内 容 是 我 积累 了 数 年 的 财富 . 虽然 


中 包含 了 全 部 的 上 课 视 频 以 及 每 天 的 补充 注解 . 这 


这 儿 年 的 上 课 内 容 十 分 相似 , 但 它们 之 间 仍 存在 一 些 细微 差别 , 这 是 因为 对 
不 同 的 学 生来 说 , 引起 他 们 兴趣 的 内 容 是 不 一 样 的 . 录制 这 些 课程 的 一 个 好 


处 是 , 我 可 以 选 出 一 些 专 


题 作为 每 学 期 的 课堂 内 容 来 讲授 , 而 其 他 的 内 容 可 


以 让 学 生 在 家 看 视频 自学 . 
你 又 是 谁 呢 ? 目前 , 我 是 威廉 姆 斯 学 院 的 一 名 数学 教授 . 我 在 耶鲁 大 学 获 
得 了 数学 和 物理 学 学 士 学 位 , 之 后 在 普林斯顿 大 学 继续 进修 并 获得 了 数学 


完 所 、 俄 雍 俄 州立 大 学 、 


博士 学 位 . 此 后 , 我 曾 (依次 ) 就 职 于 普林斯顿 大 学 、 纽 约 大 学 、 美 国 数学 和 


波士顿 大 学 、 布 关 大 学 、 威 廉 姆 斯 学 院 、 史 密斯 学 


院 以 及 曼 荷 血 学 院 . 虽然 我 对 各 领域 的 应 用 数学 课题 进行 了 大 量 研究 , 尤其 


是 so 量 的 


x ”如何 使 用 本 书 
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- 例题 求解 过 程 始 于 此 行 . 
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一 一 亚伯拉罕 ” 马 斯 洛 ,《 科 学 心理 学 》(1966) 


概率 论 是 一 门 涉及 面 非常 广 的 学 科 . 它 的 应 
, 有 了 时 也 会 被 一 些 有 
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使 用 的 教材 ,者 


有 相当 广泛 , 既 可 以 应 用 了 


不 会 


论 和 技巧 ， 


扩展 阅读 . 为 了 帮助 教师 更 好 地 规划 课程 , 教材 的 最 后 通常 会 给 出 
本 书 既 可 以 作为 任 


用 , 因为 它 通过 大 量 有 解 的 题目 以 及 对 
门 会 分 析 一 些 奇妙 的 问题 , 并 从 中 提炼 出 一 些 
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子 , 而 不 给 出 具体 的 细 六 
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量 时 


可 一 本 经 典 入 i 


班 纳 的 《普林斯顿 微 积分 读本 》 类 似 , 本 
解 的 练习 题 . 在 查阅 答案 之 前 , 你 最 好 先 看 一 看 这 些 题 
目的 完整 解答 . 与 很 多 书 不 同 的 是 , 我 们 不 
D; 我 建议 你 先 试 着 做 一 下 题 


看 证 明 过 程 就 能 
目的 并 不 是 给 出 结 
思考 问题 以 及 怎样 着 
司 去 考察 特殊 情况 , 这 样 就 能 对 题目 


中 很 多 论证 ， 
人 ~ 


证 明 并 不 像 


] 教 材 
般 性 理 


4 
I 中 


目的 是 让 你 学 会 独立 完成 模型 的 构造 并 解决 相关 问题 , 进而 断定 什么 样 


4 补充 材料 , 也 可 以 作为 主 
论 的 探讨 来 六 释 概率 
用 的 技巧 、 观 点 和 方法 . 这 样 


目 并 花 些 时 间 


几 章 高 阶 内 容 . 
了 王 
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人 这 门 课 . 
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会 只 
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目 , 当 有 问题 
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巴 全 面 论述 概率 论 的 应 用 作为 目标 . 通 


并 叙述 概率 论 的 若干 应 用 和 相关 


教材 来 使 
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改 的 
的 问题 才 值 


F 纯 数学 
任何 一 本 书 都 无 法 涵盖 概率 论 的 所 有 应 月 


给 出 了 大 量 有 
故 ; 而 本 
支 者 证 明和 例 


目的 就 是 帮 有 


y 
明 技 巧 , 通过 学 习 这 部 分 内 容 , 你 的 证 
东 和 提升 ， 另外, 对 于 那些 出 现在 概率 论 课 上 的 典型 结论 ， 
绝 大 部 分 的 完整 解答 都 能 在 本 书 中 找到 . 如 果 你 (或 者 你 所 学 的 课程 ) 


去 查看 相关 


其 次 , 概率 论 中 的 证 明 要 比 微 积分 中 的 证 明 多 很 多 , 而 这 不 应 该 让 你 感到 吃惊 . 
论 上 的 证 明 是 极 具 挑 战 的 , 而 本 书 的 主要 
任 关 . 整个 附录 A 都 在 阐述 证 
很 好 的 锻 ; 


但 你 至 少 应 该 浏览 


人 
给 出 一 个 证 


给 E 明 那么 困 


能 理 


解 定理 


想 要 表达 的 是 什么 , 或 是 


论 日 


的 最 简短 证 
证 明 结论 . 
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步 说 , 在 通 
知道 i 


有 直观 


并 不 关 


玄 如 何 去 运 
有, 而 是 通过 细致 的 叙述 来 与 你 共同 探 
此 外 , 在 证 明 结论 之 前 , 我 
的 了 解 . 这 是 极 


门 通常 会 花 


宝贵 的 技巧 ， 
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对 你 将 来 学 到 的 很 多 课程 都 会 有 帮助 . 最 后 , 我 们 会 频繁 讨论 如 何 编写 和 执行 代码 


来 检验 我 们 的 计算 结 
世纪 的 劳动 大 军 中 获得 苋 争 
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四 


否 正确 , 或 者 让 我 们 对 答案 有 


定 的 认识 . 如 果 想 在 21 


小 和 还 


内 备 编 


优势 , 那么 你 必须 


eh 
个 简 生 


的 程序 来 模拟 
些 结果 通常 会 提醒 你 留意 那些 被 遗 


因素 或 其 他 4 


十 的 


日 


在 引言 
之 外 , 这 些 例 


地 定义 每 个 概念 . 


子 还 能 用 来 引入 概率 
我 们 会 默认 你 已 经 非常 熟悉 概率 论 中 的 基本 概念 了 . 不 


程 和 模拟 的 能 力 . 能 够 写 出 一 
个 问题 的 100 万 种 可 能 情况 对 我 们 来 说 是 非常 有 用 的 , 这 


EE 


已 


天 


论 


在 这 里 , 我 们 要 做 的 只 是 随 


率 论 这 门 课 有 


定 的 认识 . 不 月 


日 担心 无 法 准 古 


励 你 如 


好 本 书 . 在 后 面 


邓 所 有 的 


那么 , 不 多 说 


生日 问题 是 我 最 喜欢 的 概率 论 练习 之 一 . 对 于 那些 大 班 授课 的 教授 来 说 , 如 


了 , 我 们 来 看 第 一 个 问题 吧 ! 


1.1 生日 问题 


在 生日 问题 上 与 学 生 打 财 , 那么 他 们 肯定 收入 颇 丰 ， 接 下 来 , 我 人 
种 表述 展开 讨论 . 花费 大 量 时 间 来 陈述 这 个 问题 并 非 毫 无 道理 . 
必须 弄 清 


步 说 , 在 没有 出 现 
为 他 们 对 问题 


地 定义 每 个 概念 ， 
经 为 你 提供 了 足够 的 背景 知识 . 我 只 希望 能 让 你 对 这 门 课程 有 个 大 体 的 认识 ， 
把 美妙 的 数学 展现 在 你 眼前 , 并 激 
儿 间 里, 我 们 有 大 量 的 时 间 来 


E 接 下 来 的 几 个 月 里 专 汶 


FP, 我 们 将 叙述 三 个 有 趣 的 问题 , 涉及 概率 论 中 的 不 同 内 容 . 除了 有 趣 
中 的 很 多 核心 概念 . 对 于 本 章 中 


的 其 他 内 容 ， 

要 慌张 , 我 们 稍 后 将 会 详细 

意 地 聊 一 些 有 趣 的 问题 , 并 让 你 对 概 
日 常 的 生活 体验 已 
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并 用 


地 学 好 这 门 课 
细节 补充 完整 
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个 


要 对 该 问题 的 几 
在 现实 生活 中 , 你 
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楚 问 题 是 什么 ; 你 要 成 为 一 名 指导 具体 工作 的 人 , 而 不 是 只 懂得 做 代数 题 
的 技术 员 . 通过 讨论 具体 细节 , 你 会 发 现 我 


们 
练 , 进而 求解 
解答 是 正确 的 , 但 


[ 么 要 这 样 做 是 非 销 习 


门 很 容易 在 无 意 中 假 定 一 些 条 件 . 进 
错误 的 前 提 下 , 不 同 的 人 可 能 会 得 到 不 同 的 答案 , 而 这 仅仅 是 因 
的 解读 是 不 一 样 的 . 因此 , 能 够 一 直 清 晰 地 认识 到 你 在 做 什么 以 及 为 
要 的 . 于 是 , 我 们 会 花费 大 量 时 间 来 陈述 这 个 问题 并 加 以 精 
问题 的 答案 并 由 此 来 强调 概率 论 中 的 许多 核心 概念 . 我 们 的 第 一 个 


在 计算 方面 相当 麻烦 . 因 


一 点 微 积 分 的 知识 来 轻松 地 逼近 答案 . 


1.1.1 ”陈述 问题 


此 , 我 们 会 在 最 


后 简短 地 描述 如 何 利用 


生日 问题 (表述 1): 房间 里 有 多 少 人 才能 保证 其 中 至 少 两 个 人 的 生日 在 同一 
天 的 概率 不 小 于 50%? 


这 看 起 来 是 个 非常 好 的 问题 . 你 的 脑海 
不 同 数量 的 人 ,比如 象棋 社 的 匀 


恩 节 庆 


Ph 应 该 正 内 


现 出 大 量 不 同 的 社交 场所 和 


FE 终 宴会 、 高 中 毕业 舞会 、 政 府 筹 款 晚宴 , 或 者 是 感 


. 不 管 是 哪 种 场合 , 我 们 关心 的 是 一 共有 多 少 人 出 席 以 及 是 否 有 两 个 人 的 


生日 在 同一 天 . 如 果 能 搜集 到 足够 多 的 数据 , 我 们 就 能 了 解 一 共 需 要 多 少 人 出 席 . 

尽管 这 看 起 来 好 像 已 经 很 完整 了 , 但 实际 上 还 有 很 多 隐藏 条 件 . 陈述 问题 一 定 
要 清晰 且 完 整 , 而 本 书 的 目的 之 一 就 是 强调 这 一 点 的 重要 性 . 这 与 微 积分 和 线性 代 
数 有 很 大 的 不 同 . 微 积分 和 线性 代数 这 两 门 课 都 非常 直 白 : 求 导 数 , 对 函数 求 积分 ， 
求解 方程 组 . 但 就 像 上 面 所 说 的 , 对 这 个 问题 的 描述 并 不 是 那么 明确 . 我 的 妻子 有 
一 个 双胞胎 姐妹 . 因此 , 在 她 的 家 庭 聚 会 上 , 总 会 有 两 个 人 的 生日 相同 "为 了 避免 
这 种 特殊 情况 , 要 对 一 般 化 的 人 群 展开 讨论 . 我 们 需要 了 解 人 们 的 生日 在 一 年 中 是 
如 何 分 布 的 , 图 1-1 是 一 个 例子 . 更 具体 地 说 , 我 们 将 假设 生日 之 间 是 相互 独立 的 ; 
也 就 是 说 , 从 某 人 的 生日 信息 中 无 法 推断 出 其 他 任何 人 的 生日 信息 . 独立 性 是 概率 
论 中 最 核心 的 概念 之 一 , 因此 会 在 第 4 章 中 进行 充分 讨论 . 
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图 1-1 2013 年 秋季 威廉 姆 斯 学 院 本 科 生 生日 分 布 


这 就 引出 了 第 二 种 表述 . 
生日 问题 (表述 2): 假设 对 每 个 人 来 说 , 出 生 在 一 年 中 任何 一 天 的 概率 都 是 相 
等 的 . 那么 , 房间 里 有 多 少 人 才能 保证 其 中 至 少 两 个 人 的 生日 在 同一 天 的 概率 不 小 
于 50%? 
虽然 这 个 表述 更 好 , 但 对 我 们 来 说 这 个 问题 仍然 非常 含糊 , 无 法 展开 讨论 . 为 
了 找到 问题 的 突破 口 , 我 们 仍 需 要 更 多 有 关 一 年 中 生日 分 布 的 信息 . 此 刻 你 应 该 会 
有 些 困 惑 : 难道 我 们 还 没有 彻底 弄 清楚 生日 是 如 何 分 布 的 吗 ? 我 们 只 说 过 任何 一 天 
Q@ 这 并 非 唯一 的 家 庭 问题 . 通常 情况 下 , 兄弟 姐妹 的 出 生日 期 几乎 都 恰好 相差 n 年 , 其 原因 与 生活 状 
况 以 及 受孕 周期 有 关 . 我 的 孩子 (Cam 和 Kayla) 都 出 生 在 3 月 , 相差 2 岁 . 他 们 最 年 长 的 两 个 
堂 兄 (Eli 和 Matthew) 都 出 生 在 9 月 , 也 相差 2 岁 . 看 一 看 你 家 里 是 什么 样 的 情况 ? 你 是 不 是 认 
为 家 人 的 生日 之 间 没 什么 关联 ? 


1.1 生日 问题 5 


成 为 某 人 生日 的 概率 都 是 相等 的 . 因此 , 如 果 假 设 没 有 人 出 生 在 2 月 29 日 , 那么 这 


就 意味 着 在 365 个 人 中 , 大 概 有 一 个 人 出 生 在 1 月 1 日 ,有 男 一 个 人 出 生 在 1 月 2 
日 , 等 等 . 还 需要 哪些 信息 呢 ? 

这 个 结果 十 分 巧妙 , 但 仍然 需要 假设 才能 成 立 . 这 样 做 有 什么 错 呢 ? 在 我 们 的 
假设 中 , 所 有 人 都 是 被 随机 挑选 出 来 的 ! 但 社交 集会 的 特性 可 能 会 导致 出 生 在 某 些 
日 子 里 的 人 比 出 生 在 其 他 日 子 里 的 人 多 很 多 . 这 看 起 来 非常 充 雇 .毕竟 , 在 一 
的 某 些 特定 日 子 里 出 生 显然 与 棋艺 精湛 或 者 足球 踢 得 好 没什么 关系 . 不 是 吗 ? 


二 


不 对 ! 看 一 看 马尔 科 姆 ”格拉 德 威 尔 在 他 的 畅销 书 《 腊 类》 中 举 的 例子 . 在 该 
书 第 1 章 中 , 他 对 “在 一 些 运动 项 目 中 , 生日 与 成 功 有 着 密切 的 关联 ”这 一 说 法 进 
行 了 研究 . 例如 , 在 加 拿 大 青少年 曲棍球 联赛 中 ,“ 有 资格 参加 某 年 龄 段 曲棍球 比赛 
的 年 龄 是 以 1 月 1 日 为 分 界 点 来 划分 的 ”. 从 青少年 时 期 开始 , 最 好 的 球员 就 特别 
受 关注 . 但 仔细 想 一 想 : 在 七 八 岁 的 年 龄 段 , ( 绝 大 部 分 ) 最 好 的 球员 年 龄 也 最 大 . 因 
此 , 那些 生日 恰好 在 分 界 点 一 一 出 生 在 1 月 和 2 月 一 一 的 球员 就 有 能 力 与 同年 
龄 段 更 小 的 球员 展开 竞争 , 从 中 脱颖而出 , 然后 进入 一 个 自我 实现 的 有 利 循环 . 他 
们 得 到 了 更 好 的 训练 , 具有 更 强 的 莞 争 力 , 甚至 拥有 最 顶尖 的 装备 . 于 是 , 这 些 年 龄 


较 大 的 球员 就 以 更 快 的 速度 变 得 更 加 优秀 , 并 在 不 久 的 将 来 获得 更 大 的 成 功 . 
在 书 中 , 格拉 德 威 尔 用 球员 的 生日 来 代替 他 们 的 名 字 :“ 这 听 起 来 不 像 是 加 拿 
青少年 曲棍球 锦标 赛 , 而 更 像 是 专门 为 摩羯 座 、 水瓶 座 和 双鱼 座 男孩 举办 的 一 场 
奇怪 的 运动 仪式 . 3 月 12 日 开始 靠近 猛虎 队 球 网 的 一 侧 , 并 把 球 传 给 了 他 的 队友 1 
月 4 日 ;1 月 4 日 又 把 球 传 给 了 1 月 22 日 , 随后 球 被 1 月 22 日 回 传 给 了 3 月 12 
日 ,并 由 3 月 12 日 直接 射 向 猛虎 队 的 守门 员 4 月 27 日. 球 被 4 月 27 日 挡 在 了 球 
门 外 , 但 又 被 来 自 温哥华 的 3 月 6 日 打 了 回去 . 他 射门 了 ! 尽管 来 自 梅 迪 辛 哈 特 的 


后 卫 2 月 9 日 和 2 


月 14 日 信 身 救 球 , 但 已 经 于 事 无 补 , 1 月 10 日 看 起 来 失望 不 


已 . 3 月 6 日 得 分 了 !” 因 此 , 如 果 我 们 出 席 的 是 加 拿 大 职业 曲棍球 球员 的 聚会 , 就 
不 能 给 出 “每 个 人 在 一 年 中 任何 一 天 出 生 的 概率 都 相等 ”的 假设 . 
为 了 简化 分 析 过 程 , 我 们 假设 每 个 人 确实 等 可 能 地 出 生 在 一 年 中 的 任何 一 天 ， 


尽管 我 们 清楚 这 个 假设 并 不 总 是 合理 的 . 赫 尔 利 写 过 一 篇 很 棒 的 文章 , 研究 的 是 当 


所 有 人 的 生日 都 不 具有 等 可 能 性 时 将 会 发 生 什么 . 此 外 , 我 们 还 假设 一 年 只 有 365 


是 说 , 我 们 假设 生日 


天 . (非常 遗憾 , 如 果 你 出 生 在 2 月 29 日 , 那么 就 不 会 被 邀请 参加 此 次 聚会 .) 也 就 


服从 均匀 分 布 . 在 第 13 章 中 , 我 们 会 详细 地 讨论 均匀 分 布 并 对 


更 一 般 的 分 布展 开 研 究 . 于 是 , 我 们 得 到 了 问题 的 完整 表述 . 

生日 问题 (表述 3): 假设 客人 的 出 生日 期 都 是 相互 独立 的 , 并 且 每 个 人 都 等 可 
能 地 出 生 在 一 年 中 的 任何 一 天 (2 月 29 日 除外 ), 那么 房间 里 有 多 少 人 才能 保证 
其 中 至 少 两 个 人 的 生日 在 同一 天 的 概率 不 小 于 50%? 


1.1.2 ”解决 问题 


现在 , 我 们 有 了 一 个 表述 完整 的 问题 , 那么 该 如 何 着 手 研究 它 呢 ? 最 常用 的 方 
法 是 考察 一 些 极端 情况 , 并 试 着 从 中 找 出 与 答案 有 关 的 信息 . 对 我 们 来 说 , 最 坏 的 
情形 是 所 有 人 的 生日 都 不 相同 . 由 于 我 们 假设 一 年 只 有 365 天 , 因此 当 有 366 个 人 
出 席 聚 会 时 就 一 定 会 出 现 “ 至 少 两 个 人 的 生日 在 同一 天 ”的 情况 ( 记 住 , 我 们 假设 
没有 人 出 生 在 2 月 29 日 ). 这 就 是 著名 的 狄 利克 雷 铝 梨 原 理 , 我 们 将 在 附录 A.11 
中 展开 讲述 . 另 一 种 极端 情况 是 , 如 果 只 有 一 个 人 出 席 聚 会 , 那么 显然 不 可 能 有 两 
个 人 的 生日 在 同一 天 . 因此 , 答案 是 在 2 和 365 之 间 的 某 个 数 . 但 到 底 是 多 少 呢 ? 
更 深入 地 思考 一 下 这 个 问题 , 我 们 发 现 如 果 有 184 个 人 出 席 聚 会 , 那么 至 少 两 个 人 
的 生日 在 同一 天 的 概率 应 该 不 小 于 50%. 给 出 这 个 判断 的 原因 是 : 如 果 其 中 有 183 
个 人 的 生日 互 不 相同 , 那么 对 进入 房间 的 第 184 个 人 来 说 , 他 与 前 面 183 人 中 的 某 
个 人 同一 天 生日 的 概率 就 至 少 为 50%. 一 年 中 的 过 半日 期 已 经 被 占用 了 ! 像 这 样 
花费 几 分 钟 时 间 来 思考 问题 并 从 中 找到 与 答案 有 关 的 线索 通常 能 为 我 们 带 来 很 大 
的 帮助 . 上 只 需要 简短 的 几 步 就 能 大 大 缩小 答案 的 范围 . 我 们 知道 答案 就 在 2 和 184 
之 间 . 虽然 这 仍 是 一 个 相当 大 的 范围 , 但 我 们 觉得 答案 更 接近 于 2 (想象 一 下 , 当 有 
170 人 出 席 聚 会 时 将 会 发 生 什么 )， 

我 们 试 着 通过 穷 举 法 来 解答 . 这 是 求解 概率 的 第 一 种 方法 . 不 妨 设 一 共有 n 人 
出 席 聚 会 , 而 且 对 每 一 个 人 来 说 , 他 在 任何 一 天 出 生 的 概率 都 是 相等 的 . 我 们 可 以 
看 一 看 这 n 个 人 所 有 可 能 的 生日 排 布 列表 , 以 及 “至 少 两 个 人 的 生日 在 同一 天 ”的 
出 现 频率 . 不 幸 的 是 , 当 n 很 大 时 整个 计算 过 程 就 是 一 场 豆 梦 . 我 们 试 着 考察 n 取 
值 较 小 的 情况 , 并 从 中 找到 解决 问题 的 线索 . 

当 只 有 两 个 人 出 席 聚 会 时 , 这 两 个 人 所 有 可 能 的 生日 排 布 方法 一 共有 3652 = 
133 225 种 . 为 什么 ? 对 第 一 个 人 来 说 , 他 的 生日 有 365 种 可 能 , 而 第 二 个 人 的 生日 
也 有 365 种 可 能 . 由 于 两 人 的 出 生日 期 是 相互 独立 的 (这 是 我 们 的 假设 前 提 之 一 )， 
因此 两 者 所 有 可 能 的 组 合 数 就 等 于 它们 个 数 的 乘积 . 由 两 个 人 生日 构成 的 有 序 对 从 
(1 月 1 日 ,1 月 1 日 ) 和 (1 月 1 日 ,1 月 2 日 ) 一 直到 (12 月 31 日 ,12 月 31 日 ). 

在 这 133 225 种 组 合 中 , 两 个 人 生日 在 同一 天 的 组 合 只 有 365 种 . 在 这 里 我 们 
注意 到 , 如 果 两 个 人 的 生日 在 同一 天 , 那么 只 要 选 定 了 第 一 个 人 的 生日 , 第 二 个 人 
的 生日 就 只 有 唯一 一 种 可 能 . 因此 , 对 于 只 有 两 个 人 出 席 的 情况 ,“ 至 少 两 个 人 的 生 
日 在 同一 天 ”的 概率 是 365/3652, 约 等 于 0.27%. 为 了 得 到 这 个 概率 , 我 们 采用 的 方 
法 是 , 用 成 功 (两 个 人 的 生日 在 同一 天 ) 的 组 合 数 除 以 所 有 可 能 的 组 合 数 (生日 序 
对 的 总 个 数 ). 
如 果 共 有 三 个 人 出 席 聚 会 , 那么 所 有 可 能 的 生日 排 布 方法 就 有 3653==48 627 125 
种 . “前 两 个 人 的 生日 在 同一 天 , 且 第 三 个 人 的 生日 与 他 们 不 同 ” 的 生日 排 布 方法 


共有 365.1.364 = 132 860 种 (第 一 个 人 


个 人 


的 生 


y= 


布 方 


确保 


的 生 


的 生 
对 我 


一 大 ”的 概率 更 大 , 还 是 


大 ? 显然 , 总 人 数 越 多 ， 


要 


AAA 


中 出 


次 ， 为 人 


日 ,3 
或 者 
当 学 


可 


法 


~ 


把 所 有 可 能 


们 始终 


132 860 种 ， 
的 生日 与 他 们 不 同 ” 的 生 
4 情况 都 考虑 进来 . 最 
一 天 . 这 种 情况 所 对 应 的 生 
日 在 同一 天 的 概率 为 398 945/48 627 125, 约 等 于 
132 860 + 132 860 十 132 8601 


日 必须 与 第 一 个 人 相同 ， 
“第 一 个 人 与 第 三 个 人 的 生 


日 排 布 方法 数 . 下 面 给 


诈 且 


日 在 同一 天 ，， 
“第 二 个 人 与 


口 


日 排 布 方法 志 


是 有 好 处 的 . 你 认为 “在 只 有 两 个 人 HH 


值得 一 提 的 是 , 在 


现 重复 计算 的 问题 . 重复 计算 是 概率 论 
过 几 次 这 样 的 错误 . 例如 ,“ 三 个 人 的 生日 在 同一 
会 错误 地 计算 成 三 


“在 三 


个 从 


“人 至少 两 个 人 的 生日 
算 的 概率 一 定 会 随 着 总 人 数 的 增多 而 不 断 变 大 , 0.82% 比 0.27% 大 也 证 实 了 这 一 


rs 利 
有 365 种 . 


+- 365, 它 表示 “ 克 


的 生日 可 以 是 一 年 中 的 外 
而 第 三 个 人 的 生日 


第 三 个 人 


一 定 与 


因 


1.1 


生日 问题 7 


E 何 一 天 , 第 二 


前 两 人 不 同 ). 类 似 地 ， 
旦 第 二 个 人 的 生日 与 他 们 不 同 ” 的 生 
的 生日 在 同一 天 , 且 
排 布 方法 也 有 132 860 种 . 但 我 们 一 定 要 非常 小 心 , 并 
可 能 的 情况 是 这 三 个 人 的 生日 在 同 
此 , 这 三 个 人 中 至 少 两 个 人 


日 排 


第 一 个 人 


在 同一 


席 的 性 


开交 


F 0.82%. 这 里 的 398 945 等 于 
E 三 个 人 中 , 至 少 两 个 人 生日 在 同一 天 ” 
n= 3 时 的 最 后 一 点 说 明 . 检验 并 查看 答案 是 否 合理 
4 况 下 , 两 个 人 的 生日 


在 同 


中 , 至 少 有 两 个 人 的 生日 是 在 


同一 天 ”的 概率 


的 概率 就 越 大 . 


因此 , 我 们 


FE 进行 上 述 论证 时 一 定 要 特别 小 心 , 因为 我 们 不 希望 在 三 元 组 


| 么 有 可 能 
月 5 日 ,3 月 5 
“后 两 人 的 生日 


现在 , 我 


能 性 都 计算 一 次 , 并 且 


在 i 
些 邪 亚 


已 条 


影 《 超 人 2》 中 , 我 最 喜欢 的 
的 扎 星 人 : 佐 德 将 军 、 马 萨 和 头脑 迟钝 的 诺 恩 . 


在 同 


日 ), 那么 我 们 可 以 认 


= 
》 


pe 


MI 


月. 
XE 


EE 复 计算 展开 
显而易见 的 ) 建议 : 不 
然 , 有 时 我 们 并 不 清 


FP 最 常见 的 错误 之 一 


次 呢 ? 举 个 例子 ,如 果 这 个 三 
为 它 描述 的 
抑或 “第 一 个 人 和 最 后 一 
习 第 3 章 中 的 组 全 与 概率 时 , 我 们 会 对 
站 给 出 下 面 这 些 (希望 是 
只 能 计算 一 次 ! 


型 
x 


前 两 人 的 生 
个 人 的 生日 在 同一 天 ”. 
大 量 讨论 . 
区 别 对待 
0 


, 绝 大 多 数 人 曾 犯 
天 ”只 能 被 看 作 一 次 成 功 , 而 非 三 


量 


元 组 是 (3 月 5 
日 在 同一 天 ”， 


要 把 每 种 


场景 之 一 


信 自 己 能 够 袭击 并 消灭 超人 . 
伍德 将 军 : 他 和 我 们 的 力量 一 样 强大 . 


莱克 斯 


在 这 里 , 话 


卢 瑟 : 


车 .、 


就 是 莱克 斯 


户 蕊 在 


襄 里 极力 讨好 那 


他 试图 


说 月 


有 他 们 , 使 他 们 相 


当然 . 但 是 , 哦 至 兽 , 他 只 有 一 个 人 , 但 你 们 有 三 个 人 
( 诺 恩 发 出 不 满 的 吐 声 ); 如 果 你 把 他 计算 两 次 
恩 以 为 他 没有 被 计算 在 内 , 他 认为 上 面 所 说 的 “三 个 人 ”是 佐 德 将 
乌 萨 和 莱克 斯 ” 卢 瑟 . 注意 ! 弄 清 
好 了 . 对 于 “至 少 两 个 人 的 生日 


, 那 你 们 就 有 四 个 人 . 


楚 你 要 计算 的 是 什么 , 并 仔细 地 计算 ! 
在 同一 天 ”的 概率 会 随 着 总 人 数 的 增加 而 不 断 


变 大 , 我 们 不 应 该 感到 惊讶 , 必须 弄 清楚 的 是 该 如 何 计算 . 就 这 点 而 言 , 我 们 仍然 可 


以 使 


用 穷 举 法 来 计算 “在 四 个 (甚至 更 多 ) 人 中 , 至 少 两 个 人 的 生日 在 同一 天 ”的 生 


呢 ? 此 时 ， 
三 个 人 的 
生日 在 同 


我 
生日 在 同一 天 ”以 及 
一 天 , 且 剩 下 


5 日 、3 


月 25 日 ,3 月 25 日 


和 3 


之 前 我 们 
重复 计算 
好 吧 


论 


1 一 p， 这 是 根据 “两 者 必 有 其 一 发 生 ” 的 基本 关系 得 
此 , 两 者 概率 之 和 一 定 等 了 
为 1). 在 第 2 章 中 , 当 正 式 定 义 某 些 概念 


件 一 一 要 么 4 发 生 , 要 么 4 不 发 生 . 因 
于 概率 的 直观 概念 (概率 是 非 负 的 ， 


担心 
, 还 必须 把 所 有 可 能 的 


站 要 考察 的 情况 会 


E 复 计算 的 问题 , 现在 则 会 担心 


有 两 个 人 的 生日 
日 在 为 外 一 天 ”( 比 如 
月 5 日 


日 排 布 方法 数 . 当 总 人 数 为 4 时 ,你 会 发 现 我 们 需要 一 个 更 好 的 计算 方法 . 为 什么 
多 . 它 不 仅 包括 “四 个 人 的 生日 
在 同一 
四 个 人 的 生日 分 别 是 3 月 
). 最 后 一 种 情况 很 好 地 补充 了 前 面 的 讨论 


在 同一 天 ”“ 恰 有 
日 


天 ”, 还 包括 “有 两 个 人 上 


局 掉 菜 种 
情况 全 部 考虑 进来 . 


, 穷 举 法 不 是 


vA 


与 


很 多 .如果 我 们 知 


个 高 效 、 令 人 满意 的 方法 .我 们 
h, 计算 对 立 事件 的 概率 “4 不 发 生 的 概率 一 有 
事件 4 不 发 生 的 概率 是 p 


J 能 性 ! 所 以 , 不 仅 要 避免 


需要 更 好 的 思路 . 在 概率 
要 比 直 接 计 算 事件 4 的 
那么 4 发 生 的 概率 就 是 


时 , 我 们 会 对 这 部 分 内 容 进 行 详细 

这 对 我 们 有 什么 帮助 呢 ? 我 
同 ” 的 概率 . 不 妨 假设 所 有 人 排 成 一 列 依 次 进入 房间 . 对 第 一 个 人 来 说 
没有 人 , 所 以 他 可 以 选择 365 天 中 的 外 
都 互 不 机 


个 人 的 时 


和 
1 论述 
站 来 计算 “ 


到 


En 个 人 中 , 所 有 人 的 生 


的 : 4 和 非 4 是 互 斥 事 


F 1. 这 些 都 是 关 


日 都 互 不 相 
于 房间 中 


候 ,“ 所 有 人 的 生日 


一 会 儿 就 


昌 同 ”的 概率 就 是 1. 


能 明白 为 什么 


有 人 了 . 为 了 保 训 
选取 . 那么 , 此 时 “ 


加 | 


E 两 个 人 的 4 


巴 1 写成 这 种 形式 会 更 


们 利 月 


率 是 p， 
三 个 人 的 
她 与 前 两 


we 
就 是 3 


一 天 ”的 概率 为 1 


们 前 面 的 


4 发 生 无 


第 


2 


生日 就 要 从 剩 下 的 365 


三 
A 


法 判断 B 


一 2=363 天 


个 人 的 生日 


364 . 363 — 2 
"365 ” 365° 由 致 


性 可 知 , 这 意味 着 “在 三 个 人 中 , 至 少 两 个 人 的 9 


结论 是 一 致 的 . 


365 . 364 . 363 _ 
365 ” 365 ”365 一 


E 何 一 天 作为 其 生日 . 因此 , 当 房 间 中 


否 发 生 , 反之 亦 然 ), # 
E 的 概率 是 gq, 那么 4 和 B 同时 发 生 的 概率 就 是 p. 9. 
三 个 人 进入 房间 时 , 如 果 想 让 所 有 人 的 生 
任意 选取 . 
都 不 相同 的 概率 是 闻 , 那么 这 三 个 人 的 生 


只 有 bi 
我 们 把 1 改写 成 365/365， 


好 . 当 第 二 个 人 进入 时 , 房间 里 已 经 
E 日 不 在 同一 天 , 第 二 个 人 的 生日 必须 从 剩 下 的 364 天 
所 有 人 的 生日 都 互 不 相同 ”的 概率 就 
上 了 独立 事件 的 概率 是 可 乘 的 这 一 事实 这 意味 着 , 如 
独立 的 (也 就 是 说 , | 
B 发 
类 似 地 , 当 


是 3 . 364. 在 这 里 , 我 
果 事件 4 和 B 是 相互 


上 是 4 发 生 的 概 


日 都 互 不 相同 , 那么 第 
因此 , 对 第 三 个 人 来 说 ， 
日 互 不 相同 的 概率 
E 日 在 同 


365 -365.364.363， 即 398 945/48 627 125. 这 与 我 


注意 这 种 


计算 方法 的 相对 简便 


我 们 不 再 


担心 重复 计算 的 问题 ， 


LE. 通过 计算 互补 概率 ( 即 目标 事 人 
届 那 些 能 使 事件 发 


也 不 必 担 心 遗 ) 


不 发 


的 概率 ) 
的 可 能 情况 . 


1.1 生日 问题 9 


和 


沿 着 这 种 思路 去 论证 , 我 们 发 现 “ 在 n 个 人 中 , 所 有 人 的 生日 都 互 不 相同 ”的 
概率 是 


365 364 365—(n—l) 

365 365 365 
对 于 上 面 的 表达 式 , 最 困难 的 一 点 就 是 指出 最 后 一 步 是 什么 ， 第 一 个 人 的 分 子 是 
365, 也 就 是 365 一 0, 第 二 个 人 的 分 子 是 364 = 365 一 1 我 们 可 以 从 中 找 出 规律 , 并 
得 出 第 ”个 人 的 分 子 是 365 一 (” 一 1)( 因 为 减 掉 的 数 就 等 于 这 个 人 的 编号 减 1). 使 
用 连 乘 符号 , 这 个 结果 可 以 改写 成 


2 365 一 大 
II 365 


它 是 由 连 加 符号 推广 而 来 的 . 就 像 foax 是 ao 十 Qi 十 … 十 am-1 十 am 的 缩写 ， 
我 们 把 aoa1…am_1iam 简写 成 TT?_oax， 在 微 积分 中 , 你 或 许 还 记得 空 和 (empty 
sum) 的 定义 是 0， 按 照 这 种 “正确 ”的 约定 , 空 积 (empty product ) 应 该 被 定义 
为 1. 

如 果 引 入 另外 一 种 符号 , 那么 表达 式 就 可 以 用 一 种 优美 的 方式 来 展现 . 一 个 正 
整数 的 阶乘 指 的 是 所 有 小 于 或 等 于 该 数 的 正 整 数 之 积 . 我 们 用 感叹 号 来 表示 阶乘 . 
如 果 m 是 一 个 正 整数 , 那么 ml = m:(m 一 1).(m 一 2)…3.:2.1. 于 是 3!= 3.2.1= 6， 
5! = 120. 事实 证 明 , 让 0! = 1 非常 有 用 (这 与 我 们 “ 空 积 为 1” 的 约定 是 一 致 的 ). 
使 用 阶乘 符号 , 我 们 得 到 “在 n 个 人 中 , 所 有 人 的 生日 都 互 不 相同 ”的 概率 是 


也 一 二 


TI 365—k 365.364...(365— (n—1)) 

en 0 0 Ci 
365.364...(365— (n—1)) (365—n)! 365! 
本 3657 (365—n)! 3657.(365—n)! 


有 必要 解释 一 下 为 什么 要 乘 以 (365 一 n)!/(365 一 n)!. 在 数学 里 , 与 1 相 乘 是 个 非常 
重要 的 技巧 . 如 果 让 一 个 表达 式 乘 以 1, 那么 它 的 取 值 显然 不 会 发 生 任何 改变 . 这 
样 做 的 好 处 在 于 , 我 们 可 以 对 代数 因 式 进 行 重组 , 还 能 把 不 同 的 关系 凸显 出 来 . 在 
本 书 中 , 我 们 可 以 看 到 改写 代数 表达 式 所 带 来 的 各 种 好 处 . 有 时 是 强调 了 问题 的 不 
同方 面 , 有 时 是 对 计算 过 程 进一步 简化 . 在 上 式 中 ,“ 与 1 相 乘 ”使 得 分 子 可 以 改写 
成 相当 简单 的 3651. 

由 于 上 述 乘 积 是 “n 个 人 中 任意 两 个 人 的 生日 都 不 相同 ”的 概率 , 所 以 要 想 解 
决 问题 , 我 们 必须 找到 能 使 这 个 乘积 小 于 1/2 的 最 小 的 n， 因 此, 如 果 这 个 概率 小 
于 1/2, 就 意味 着 “至 少 两 个 人 的 生日 在 同一 天 ”的 概率 不 小 于 50%.( 牢 记 : 互补 概 
率 ! ) 遗憾 的 是 , 这 计算 起 来 并 不 容易 . 我 们 必须 不 断 地 乘 上 一 个 新 项 , 直到 乘积 首 
次 小 于 1/2 为 止 . 在 这 个 过 程 中 , 我 们 得 不 到 什么 启发 , 也 无 法 进一步 推广 . 例如 ， 


上 


火星 上 的 一 年 差不多 是 地 球 上 的 两 年 . 如 果 我 们 移居 到 火星 上 , 将 会 发 生 什么 ? 这 
个 问题 的 答案 又 会 是 什么 ? 

对 于 式 (1.1) 右 端 的 表达 式 , 我 们 可 以 用 试 错 法 来 计算 它 在 n 取 不 同 值 时 的 结 
果 . 但 这 种 做 法 存在 一 个 问题 : 如 果 我 们 使 用 的 是 计算 器 或 者 Microsoft Excel, 那么 
365! 或 者 365"” 就 会 导致 内 存 溢出 (而 像 Mathematica 和 Matlab 这 样 的 高 级 程序 
可 以 处 理 比 这 更 大 的 数 ). 因此 , 我 们 不 得 不 采用 逐 项 相 乘 的 方法 . 最 终 的 结果 标记 
在 图 1-2 中 . 


1.0[ 


0.8[ 


0.2 

[ga LU  D 

10 20 30 40 50 

图 1-2 ” n 个 人 中 至 少 有 两 个 人 的 生日 在 同一 天 的 概率 (一 年 有 365 天 , 每 一 天 都 
等 可 能 地 成 为 生日 , 所 有 人 的 出 生日 期 都 相互 独立 ) 


通过 乘法 运算 或 者 观察 图 中 的 点 , 我 们 看 到 问题 的 答案 是 23. 特别 是 当 房 间 
里 有 23 个 人 时 ,“ 至 少 两 个 人 的 生日 在 同一 天 ”的 概率 大 约 是 50.7%. 当 房 间 里 有 
30 个 人 时 , 这 个 概率 差不多 上 升 到 了 70.6%. 当 有 40 个 人 时 , 概率 上 升 到 了 89.1%. 
当 有 50 个 人 时 , 概率 上 升 到 了 惊人 的 97%. 在 大 班 授课 时 , 教授 通常 会 与 学 生 赌 5 
美元 , 断言 “教室 里 至 少 有 两 个 人 的 生日 在 同一 天 ”. 从 上 面 的 分 析 可 以 看 出 , 如 果 
教室 里 的 人 数 不 少 于 40, 那么 教授 就 非常 安全 (至 少 没有 赌 输 的 危险 , 但 学 院 或 者 
学 校 可 能 会 对 打赌 这 件 事 感 到 不 满 ). 

由 于 本 书 的 目的 之 一 是 强调 编程 能 力 , 因此 我 们 给 出 一 个 简单 的 Mathematica 
程序 , 它 可 以 生成 图 1-2. 

(* 计算 生日 概率 的 Mathematica 代 码 *) 

(* 初始 化 “生日 在 同一 天 ”和 “生日 不 在 同一 天 ”的 概率 列表 *) 

(* 因为 递归 化 需要 存储 之 前 的 值 #) 

noshare = {{1，1}}; (* 开始 时 ， 生 日 不 在 同一 天 的 概率 是 100Y *) 

share = {{1，0}}; (* 开始 时 ， 生 日 在 同一 天 的 概率 是 0% *) 

currentnoshare = 1; (* 当前 生日 不 在 同一 天 的 概率 *) 

For[n = 2, n <= 50, n++,，(* 将 计算 前 50 个 人 的 情况 *) 


( 
P 


1 


{ 

newfactor = (365 - (n-1))/365; (* 乘积 的 第 二 项 *) 

(+ 更 新 “生日 不 在 同一 天 ”的 概率 *) 

currentnoshare = currentnoshare * newfactor; 

noshare = AppendTo[noshare, {n, 1.0 currentnoshare}]; 
(* 更 新 “生日 在 同一 天 ”的 概率 *) 

share = AppendTo[share, {n, 1.0 - currentnoshare}]; 

}]; 

* 输出 “生日 在 同一 天 ”的 概率 *) 

Tint [ListPlot [share，AxesLabel -> {"n", "Probability"}]] 


.1.3 ”对 问题 和 答案 的 推广 : 效率 


虽然 我 们 解决 了 最 初 的 生日 问题 , 但 从 计算 的 角度 来 看 ， 


1.1 生日 问题 11 


这 个 结果 并 不 令 人 满 


意 . 如 果 改 变 一 年 的 总 天 数 , 那么 就 必须 重新 计算 一 次 . 因此 


的 结果 , 但 对 于 一 各 


趣 的 是 , 这 个 答案 是 只 需要 31 个 人 ! 


果 出 现 的 概率 是 相等 的 , 那么 需要 进行 多 少 次 试验 才能 使 “至 少 两 次 试验 的 结果 相 
同 ” 的 概率 为 50%? 这 个 问题 有 两 种 可 能 的 应 用 . 第 一 , 假设 我 们 有 一 些 麦 片 包装 


, 虽然 得 到 了 在 地 球 上 
F 约 有 687 天 的 火星 来 说 , 我 们 并 不 能 立刻 得 到 问题 的 答案 . 有 


尽管 我 们 不 太 可 能 在 火星 上 与 炎 星 人 一 起 参加 聚会 , 但 
这 个 问题 可 以 转化 成 如 下 形式 : 一 个 随机 试验 共有 D 种 可 能 的 结果 , 并 且 每 种 结 


ws 人 
盒 , 每 个 盒子 


术 


有 关 的 基本 事实 , 还 要 知道 前 m 个 正 整 数 之 和 的 计算 公式 (我 们 能 很 快 地 把 它 推 


想 要 的 更 多 . 我 们 希望 


FP 都 等 可 能 地 放 着 ”个 不 同 玩具 中 的 一 个 . 那么 在 首次 得 到 两 个 相同 
的 玩具 之 前 , 我 们 已 经 得 到 了 多 少 个 玩具 ? 第 二 , 假设 某 种 东西 正在 破坏 某 个 系统 
(或 许 是 酸雨 正在 侵蚀 建筑 物 , 又 或 许 是 内 电 正 在 烧毁 电缆 )， 

全 破坏 . 如 果 在 每 次 攻击 中 , 所 有 地 方 都 等 可 能 地 被 击 中 , 那么 问题 就 变 成 了 : 需要 
进行 多 少 次 攻击 才能 使 得 至 少 一 个 系统 被 摧毁 . 


是 这 种 推广 十 分 重要 . 


必须 击 中 两 次 才能 完 


在 当代 数学 中 , 这 是 一 个 常见 的 主题 只 知道 求 某 个 量 


4 算法 是 不 够 的 , 我 们 


得 到 一 个 高 效 且 便于 使 用 的 算法 , 最 好 能 得 到 一 个 不 错 的 闭 
型 解 , 这 样 就 能 看 出 答案 是 如 何 随 着 参数 的 改变 而 发 生变 化 的 . 就 这 一 点 而 言 , 前 
面 的 答案 相当 失败 . 


本 贡 随 后 会 介绍 一 些微 积分 中 的 常用 知识 . 我 们 需要 了 解 与 log z 的 泰勒 级 数 


导出 来 ). 记 住 , log z 是 以 e 为 底 x 的 对 数 ; 数学 家 们 没有 使 用 jn x 是 因为 log z 
和 e? 的 导数 都 很 “漂亮 ”, 但 logs x 和 b” 的 导数 却 有 些 “ 杂 乱 ”( 这 能 让 我 们 记 
住 b 的 自然 对 数 应 该 放 在 哪里 ). 如 果 你 没 学 过 微 积分 , 那 就 略 过 下 面 的 论证 , 只 要 


知道 这 个 主题 是 如 何 发 挥 作 


近来 得 到 logz 的 一 个 类 似 逼 近 . 


用 的 就 行 了 . 如 果 你 没 见 过 泰勒 级 数 , 那 就 通过 切线 到 


我 们 将 证 明 如 何 利用 一 些 简单 的 代数 知识 来 推导 下 面 这 个 著名 的 表达 式 : 如 果 


下 面 给 出 用 到 的 微 积分 


上 上 


出 席 聚 会 的 每 个 人 都 等 可 能 地 出 生 在 忆 天 中 的 人 
个 人 才能 使 得 “至 少 两 个 人 的 生日 


知识 


F 何 一 天 , 那么 大 约 需 要 VD .21og35 
在 同一 天 ”的 概率 为 50%. 


。 当 |z| < 1 时 , log(1 一 z) 的 泰勒 级 数 展开 式 为 一 怕 1 zx!1/1， 如 果 z 的 取 


值 较 小 , 那么 因为 x 


2 远 小 了 


常 小 的 误差 . 另 种 思路 是 ， 


y 一 了 (a) = 六 (qa)(z 一 Q). 这样 
( 记 住 , 广 二 


斜率 为 J(a) 的 直线 


线 斜 率 ). 因此 , 当 z 与 
一 个 很 好 的 逼近 . 此 时 , f(z) = log(1 一 xz) 并 |] 


Fz， 所 以 log(1 一 xz) 约 等 于 -x 加 上 一 个 非 
| 线 yy = f(x) 在 x = a 处 的 切线 方程 是 


改 是 因为 我 们 想 要 得 到 一 条 经 过 点 (a, f(a)) 且 


与 a 的 中 


E a 处 的 导数 就 是 这 条 曲线 在 z = a 处 的 切 
E 离 很 近 时 , f(Q) 十 了 (a)(z 一 a) 就 是 对 f(x) 的 


日 a = 0. 于 是 f(0) = logl1 = 0， 


jz) = 二 ,这 意味 着 站 (0) = -1. 由 此 可 知 切线 方程 就 是 y= 0 一 1.x. 换 
名 话说 , 当 zx 取 值 较 小 时 , log(1 一 x) 近似 于 -x. 在 讨论 中 心 极限 定理 的 证 
明 时 , 我 们 还 会 遇 到 这 种 展开 式 . 


们 还 可 以 给 出 一 个 简洁 的 直接 证 明 . 写 出 原始 序列 , 并 在 其 下 方 


jol 二 m(m+1)/2. 这 个 式 子 通 常 利 用 归纳 法 来 证 明 (参见 A.2.1 节 ), 但 我 


再 把 序列 以 


倒序 写 一 遍 . 然后 把 所 有 数 逐 列 相 加 : 第 一 列 是 0+m, 第 二 列 是 1+(m 一 1)， 


依 此 类 推 , 最 后 一 列 是 m1 


是 m(m 十 1)/2. 


+- 0. 我 们 注意 到 , 每 列 的 数 之 和 都 是 m, 并 且 一 共 
有 m 十 1 列 . 因此 , 被 计算 两 次 的 序列 之 和 为 m(m 十 1), 那么 原 序列 之 和 就 


我 们 利用 这 些 知识 来 分 析 式 (1.1) 左 端的 乘积 . 尽管 是 在 一 年 有 365 天 的 前 提 


下 计算 的 , 但 这 种 计算 方法 很 容易 推广 到 一 年 有 任意 多 天 的 情况 , 或 者 有 任意 多 个 


事件 的 情况 . 


k 人 


首先 把 2385 改写 成 1 


其 中 n 是 总 人 数 . 我 们 经 常 


365’ 分 


n—l1 


k 
m= 了 (1- 疼 )， 
k=0 


使 月 


可 能 还 记得 像 黎 曼 和 、 黎 曼 积 分 这 村 


的 一 个 技巧 是 取 乘 积 的 对 数 . 从 现在 
到 乘积 , 你 就 要 取 其 对 数 , 并 形成 一 种 巴 甫 洛 夫 条 件 反射 . 如 果 学 过 微 积 分 , 那 
对 和 就 有 一 定 的 了 解 . 关于 和 与 积分 之 间 的 相互 转化 , 我 们 有 一 套 庞 大 


发 现 pzn( 所 有 人 的 生日 都 不 相同 的 概率 ) 是 


人 口 


的 理论 . 


口 ， 只 要 
么 


ll 


人 


守 


人 


的 名 词 . 但 要 注意 , 在 乘积 里 并 没有 类 似 的 相 


念 . 我 们 所 熟知 的 只 有 和 . 品 


乘积 转化 成 和 , 这 样 就 能 进入 熟悉 的 领域 . 如 果 你 不 清楚 对 数 为 
是 时 候 来 了 解 它 了 .对 数 法 则 是 标准 化 测试 的 内 容 , 所 以 我 们 在 这 上 
实际 上 , 对 数 法 则 是 解决 很 多 问题 的 好 方法 . 


有 然 我 们 


对 于 乘积 了 解 得 并 不 多 , 但 会 看 对 
十 么 有 


对 数 可 以 于 


[ 旺 


下 


j,， 那 现在 


不 


展开 讨论 


另外 , 取 对 数 之 所 以 会 产生 如 此 大 的 作 上 
log(zxy) 


识 , 但 对 乘积 却 知道 
积 转化 成 一 个 和 : 


首 得 很 少 . 1 


1.1 生日 问题 13 


是 因为 我 们 熟知 大 量 与 和 和 有关 的 知 
二 logz 十 logy 可 知 , 取 对 数 能 把 上 面 的 乘 


n—1l1 


k 


k=0 


现在 把 这 里 的 对 数 进行 泰勒 展开 , 令 v = 8/365. 因为 我 们 假定 n 和 远 小 于 365, 所 以 
去 掉 误 差 项 后 就 得 到 
n—1l 天 
log pn 包 一 一 一 . 
2 365 
利用 第 三 条 微 积 分 知识 , 可 以 对 这 里 的 和 进行 估算 , 并 得 到 
vem ~ 一 弓 汪 
由 于 我 们 想 要 得 到 的 概率 是 50%, 所 以 令 pn 等 于 1/2, 从 而 有 
log(1/2) 一 ee 0 


或 者 


(n— 1)n 365.21l0g2 


(因为 log(1/2) = 一 log2). 又 


因为 n 必须 是 
23, 而 这 恰好 与 我 们 前 面 


义 使 得 7” 守 22.49. 又 


因为 (n 一 Dns 
OO V365.210g2. 


精确 计算 的 结果 相 吻 合 . 沿 着 上 述 


2 | 
7 ，J 征 


整数 , 所 以 这 个 式 子 告诉 我 们 n 应 该 是 22 或 
时 路 去 论证 , 如 果 一 


过 
者 
年 


在 生日 问题 中 , 我 们 
n2, 并 由 此 得 到 需要 的 总 
的 差距 极 小 . 这 相当 神奇 : 
的 
的 乘积 计算 . 
在 图 1-3 中 , 一 年 的 总 天 数 
真实 答案 进行 比较 ， 


: 娶 


通过 


果 与 


结果 . 只 不 过 多 做 了 一 点 工作 , 误差 就 下 降 到 仅 为 0.0056! 我 们 完全 


有 DD 天 , 那么 问题 的 答案 就 是 V 万 .2log 7. 
用 一 个 更 好 的 估 
人 数 为 3 十 V365.21log3. 这 个 值 约 等 于 22.9944, 它 与 23 


注 


n(n 一 1) 守 (n 一 1/2)? 来 代替 n(n 一 1) 守 


几 次 简单 的 近似 计算 , 我 们 得 到 了 与 23 非常 接近 
避 了 大 量 


日 


里 


10 变动 到 1 x 105. 


在 此 过 程 中 , 我 们 把 估算 结 


并 发 现 它们 惊人 的 一 致 一 一 从 外 表 上 看 , 两 者 没有 任何 
区 别 ! 当 一 年 的 总 天 数 较 多 时 , 估算 的 结果 非常 接近 于 真实 答案 , 但 这 并 


不 是 一 件 


让 人 感到 吃惊 的 事 一 一 一 年 的 总 天 数 越 多 , n 就 越 大 , 泰勒 展开 式 的 误差 就 越 小 . 


200 
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图 1-3 nn 表示 在 一 年 有 D 天 的 前 提 下 (每 一 天 都 等 可 能 地 成 为 生日 , 所 有 人 的 
出 生日 期 都 相互 独立 ), 保证 “至 少 两 个 人 的 生日 在 同一 天 ”的 概率 为 50% 
所 需要 的 最 少 人 数 . 我 们 把 真实 答案 ( 黑 点 ) 和 估算 结果 VD .21og2( 灰 
线 ) 都 标记 在 图 中 . 注意 两 者 显著 的 一 致 性 : 我 们 看 不 出 估算 结果 与 真实 
答案 之 间 的 区 别 


1.1.4 ”数值 检验 


在 理论 计算 之 后 , 你 最 好 通过 数值 模拟 来 检验 一 下 答案 是 否 合理 . 下 面 的 Ma- 
thematica 代码 可 以 算出 “mn 人 中 至 少 有 两 个 人 的 生日 在 同一 天 ”的 概率 . 
birthdaycdf [num_, days_] := Module[{}, 

(* num 是 我 们 操作 的 次 数 *) 

(* days 是 一 年 的 总 天 数 *) 

For[d = 1, d <= days, d++, numpeople[d] = 0]; 
(* 初始 化 为 d 人 中 每 个 人 的 生日 都 不 在 同一 天 *) 


For[n = 1, n <= num, n++, 
{ (* 开始 对 n 循 环 *) 
Share = 0; 
bdaylist = 个 ; (* 这 里 将 存储 房间 里 人 们 的 生日 *) 
k = 0; (* 初始 化 为 0 个 人 *) 
While [share == 
{ 
(* 随机 选择 一 个 新 的 生日 *) 
x = RandomInteger[{1, days}]; 
(* 看 看 新 生日 是 否 包含 在 集合 中 *) 
(* 如 果 不 包含 ， 则 添加 ; 如 果 包 含 ， 则 结束 *) 
If [MemberQ[bdaylist, x] == False， 


3 


bdaylist = AppendTo[bdaylist, x], 
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share = 1]; 
k = k+ 1; (* 人 数 增加 1 *) 
(* 如 果 只 有 一 个 相同 的 生日 ， 那 么 从 这 个 人 开始 ， 所 有 numpeople 都 加 1 *) 
If[share == 1, For[d = k ，d <= days, d++, 
numpeople[d] = numpeople[d] + 1]; 
]; (* 记录 何 时 匹配 *) 
(* 就 像 从 那 一 刻 开 始 所 做 的 cdf 一 样 *) 
}]; (* 结束 while 循环 *) 
站]; (* 结束 对 n 的 循环 *); 


bdaylistplot = {}; 
max = 3 * (.5 + Sqrt[days Log[4]]); 
For[d = 1, d <= max, d++, 
bdaylistplot = 
AppendTo[bdaylistplot, {d, numpeople[d] 1.0/num}] 
] ; (* 结束 对 d 的 循环 *) 
(* 输出 所 观察 到 “生日 在 同一 天 ”的 概率 ， 它 是 总 人 数 的 函数 *) 
Print [ListPlot[bdaylistplot, AxesLabel -> {People, Prob}]]; 
Print[ 
"Observed probability of success with 1/2 + Sqrt[D log(4)] people 
is ", numpeople[Floor[.5 + Sqrt[days Log[4.]]]]*100.0/num, "%."]; 
(* 这 是 我 们 的 理论 预测 *) 
f[x_] := 1 - Product[1 - k/days, {k, 0, Floor[x]}]; 
(* 利用 Show 函数 同时 输出 我 们 的 观测 数据 和 预测 *) 
Print[ 
Show[Plot[f[x], {x, 1, max}], 
ListPlot[bdaylistplot, AxesLabel -> {People, Prob}] 
]]; 
theorybdaylistplot = {}; 
For[d = 1, d <= max, d++, 
theorybdaylistplot = AppendTo[theorybdaylistplot, {d, f[d]}]]; 
Print[ 
ListPlot[{bdaylistplot, theorybdaylistplot}, 
AxesLabel -> {People, Prob}]]; 
]; 


上 面 的 代码 考虑 了 num 这 组 变量 , 一 年 的 总 天 数 用 day 来 表示 , 同时 还 涉及 了 很 
多 不 同 的 显示 选项 . 此 外 , 它 还 计算 了 通过 观察 得 到 的 “在 1/2 十 VDlog4 个 人 中 


至 少 有 两 个 人 生日 在 同一 天 ”的 概率 . 我 们 把 这 个 模拟 结果 标记 在 图 1-4 中 , 其 中 
对 一 年 有 365 天 的 情况 进行 了 100 000 次 试验 . 从 1/2 十 VDlog4 的 估计 点 中 可 以 
得 出 , 所 求 概率 为 47.8%; 与 我 们 做 过 的 所 有 近似 相 比 , 这 个 结果 已 经 相当 不 错 了 . 
至 于 该 事件 的 累积 概率 , 实验 结果 与 理论 结果 之 间 的 比较 会 相当 惊人 , 这 充分 说 明 
了 我 们 没有 出 错 ! 

概率 

1.0 


图 1-4 实验 与 理论 的 比较 : 100 000 次 尝试 , 其 中 一 年 有 365 天 


1.2 ”从 投篮 到 几何 级 数 


本 贡 的 目的 是 介绍 数学 中 一 些 常 用 的 重要 结果 , 尤其 是 概率 论 中 的 那些 . 虽然 
学 习 这 部 分 内 容 的 方法 是 考察 一 场 特 殊 的 篮球 赛 , 最 终 的 结果 却 可 以 应 用 于 许多 领 
域 . 因此 , 在 接 下 来 阅读 本 书 的 过 程 中 , 希望 你 能 把 这 部 分 内 容 牢记 在 心 . 在 讨论 过 
一 些 推广 之 后 , 我 们 会 给 出 另 一 个 有 趣 的 问题 . 这 个 问题 的 答案 有 点 复杂 , 有 一 篇 
很 不 错 的 论文 讲 的 就 是 这 个 问题 的 求解 , 因此 这 里 不 对 它 进 行 详 细 论述 . 相反 , 我 
们 会 把 精力 放 在 如 何 解决 这 样 的 问题 上 , 这 是 一 项 非常 重要 的 技能 . 在 遇 到 困难 时 ， 
人 们 很 容易 感到 泪 形 , 而 且 通常 不 清楚 该 如 何 开始 . 我 们 会 讨论 一 些 解决 问题 的 常 
用 方法 , 如 有 果 和 掌握 住 这 些 技巧 , 你 就 可 以 反复 地 去 应 用 它们 , 从 而 使 其 发 挥 更 大 的 
作用 . 


1.2.1 ”问题 和 解答 


精彩 的 投篮 : 想象 一 下 , 拉 里 ” 伯 德 和 魔术 师 约翰 逊 决定 不 展开 激烈 的 比赛 
( 见 图 1-5), 而 是 进行 一 对 一 的 投篮 竞赛 , 赢 者 胜出 . (在 我 成 长 的 过 程 中 , 他 们 是 
两 位 最 棒 的 超级 巨星 . 你 可 以 把 拉 里 ” 伯 德 替换 成 保罗 ”皮尔 斯 , 让 科比 ” 布 莱 恩 
特 代 奉 魔术 师 约翰 逊 , 这 样 或 许 会 更 有 助 于 你 理解 . 你 可 以 想 一 下 我 是 在 哪里 长 大 
的 以 及 本 节 写 于 哪 一 年 .) 这 两 位 超级 巨星 轮流 投篮 , 并 且 投篮 时 所 站 的 位 置 相同 . 
假设 拉 里 ” 伯 德 每 次 投篮 的 命中 率 为 p( 那 么 失败 的 概率 就 是 1 一 p), 而 魔术 师 约 
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翰 逊 每 次 投篮 的 命中 率 为 g (失败 的 概率 就 是 1 一 g). 如 果 拉 里 ” 伯 德 先 投 , 那么 
他 在 投篮 竞赛 中 获胜 的 概率 是 多 少 ? 

这 个 问题 是 不 是 很 简洁 明了 ? 从 总 体 上 
来 看 的 确 如 此 , 但 正如 在 生日 问题 中 所 看 到 
的 那样 , 我 们 有 必要 花 些 时 间 来 仔细 思考 这 
个 问题 ， 并 确保 没有 做 任何 隐藏 假设 ， 有 一 
点 需要 强调 : 这 是 一 个 数学 问题 , 而 不 是 一 
个 实际 问题 . 我 们 假设 拉 里 ” 伯 德 每 次 投篮 
的 命中 率 始终 为 p. 他 从 不 疲倦 , 观众 也 不 会 
对 他 造成 任何 (正面 的 或 者 负面 的 ) 影响 . 魔 
术 师 约翰 逊 也 是 如 此 当然, 这 在 现实 生活 
中 是 很 荒 雇 的 ; 如 果 不 考虑 其 他 , 在 一 年 的 投 
篮 之 后 , 我 们 就 认为 球员 会 很 疲倦 , 这 将 导致 
他 们 的 命中 率 下 降 . 但 是 , 这 是 在 数学 课 上 ， 
而 不 是 篮球 场 上 , 我 们 不 需要 担心 如 何 让 我 
们 的 球员 拥有 超人 的 体力 . 这 个 问题 还 可 以 
推广 到 一 般 的 “人 类 ”球员 上 , 我 们 把 这 部 分 图 15 ” 拉 里 伯 德 和 魔术 师 约 翰 进 ， 


op 
全 


内 容留 给 读者 . 摄 于 1985 年 在 波士顿 花园 举 

虽然 我 们 选择 将 其 称 为 篮球 问题 ,但 许 办 的 NBA 总 决赛 第 2 场 比 
多 比赛 都 遵循 这 种 一 般 模式 .概率 论 中 的 一 赛 (5 月 30 日 ). 图 片 来 自 于 
个 常见 问题 是 ， 对 于 某 个 不 断 重复 的 进程 ， 史 蒂 大 力 普 大 斯 其 


找到 它 首次 成 功 所 需 等 待 时 间 的 分 布 . 例如 ， 
抛 撕 一 枚 硬币 , 正面 朝 上 的 概率 为 p, 反面 朝 上 的 概率 为 1 一 p. 两 个 (或 更 多 ) 人 轮 
流 抛 一 枚 硬币 , 首先 抛 出 正面 (或 反面 ) 的 那个 人 获胜 . 把 这 个 问题 进一步 复杂 化 的 
方法 有 很 多 . 我 们 可 以 让 更 多 人 参与 进来 , 也 可 以 让 概率 发 生 改 变 . 我 们 把 这 些 推 
广内 容 放 在 以 后 讨论 , 现在 继续 考察 简单 的 投篮 问题 . 一 旦 学 会 了 如 何 解决 这 个 问 
题 , 我 们 就 为 求解 其 他 问题 做 好 了 充分 的 准备 . 

解决 这 个 问题 的 标准 方法 是 写 出 一 些 概率 , 然后 利用 几何 级 数 公 式 来 计算 它们 
的 和 . 


几何 级 数 公 式 : 设 > 是 一 个 绝对 值 小 于 1 的 实数 , 那么 


Ym 六 十 72 十 73 十 …: 


TT 


n=0 


在 本 节 末 尾 , 我 会 回顾 如 何 证 明 这 个 有 用 的 公式 . 利用 几何 级 数 公 式 解 决 这 个 


问 


口 


题 之 后 , 我 们 会 
门将 采 月 


很 寻 


上 一 和 


讨论 另外 一 种 证 
PF 称 为 代 回 法 (Bring It Over Method) 的 强大 技巧 . 感谢 亚 历 克 斯 
梅 伦 , 他 在 威廉 姆 斯 学 院 的 微分 方程 课 上 提 


明 方 法 , 它 可 以 推导 


EE 要 , 在 数学 的 其 他 方面 也 十 分 习 


蚂 女 ， 


我 们 将 在 稍 


多 内 容 


必 


篮 都 必须 失败 . 


必 


是 因 


拉 里 


n. 如 果 n= 1, 就 意 
第 一 次 投入 


为 这 利 


方法 非 销 习 


要 和 有 月 


出 了 这 个 说 法 . 这 利 


方法 . 对 于 每 一 


出 儿 何 级 数 公式 的 证 明 ! 我 


民 


技巧 不 仅 在 概率 论 
子 中 看 到 这 一 点 . 正 


后 的 例 


昌 , 我 们 才 把 它 放 到 了 本 书 的 开头 . 你 应 该 从 一 开始 
就 看 到 “好 的 ”数学 , 这 意味 着 数学 不 仅 要 美丽 , 还 要 强大 和 有 用 . 接 下 来 会 
容 , 如 果 你 愿意 花 时 间 来 消化 它们 , 那么 你 a 
首先 , 我 们 来 讨论 解决 这 个 问题 的 标准 


谈 到 很 


更 加 丰厚 . 
个 正 整数 n, 我 们 计算 


伯 德 在 第 ”次 投篮 后 获 


对 就 成 功 了 ， 


由 于 拉 里 1 


拉 晶 


1] 今 7 


这 里 
口 


时 必须 成 功 . 这 个 寻 


=( 


拉 里 


和 
ba 


率 之 和 . 我 们 没有 重 
青 况 ， 如 果 拉 里 1 


1 


现在 , 我 们 已 经 把 拉 


. 也 就 是 说 , 他 获胜 


白 德 在 第 ”次 投篮 后 获胜 
和 n 次 投篮 后 获胜 , 他 的 


胜 的 概率 . 为 了 得 


味 着 拉 里 _” 伯 德 在 第 一 次 投篮 时 就 
且 成 功 的 概率 为 p. 如 果 n= 2, 那么 拉 昌 
篮 后 获胜 . 为 了 让 拉 里 ” 伯 德 获得 第 二 次 投篮 机 会 , 他 和 魔术 ) 
白 德 第 一 次 投篮 失败 的 概率 为 1 一 p, 而 魔术 师 约翰 逊 
第 一 次 投篮 失败 的 概率 为 1 - 9 所以“ 拉 里 ” 伯 德 和 魔术 几 
均 失 败 , 并 且 


伯 德 的 第 二 次 投篮 成 功 ”的 概率 等 


到 答案 先 来 才 


虑 一 些 取 值 较 小 的 


获得 了 胜利 . 也 就 是 说 , 他 
伯 德 在 第 二 次 投 


币 约 验 逊 的 第 一 次 投 


i 约 输 进 的 第 一 次 投篮 
(1 一 p)(1 一 gq)p = rp, 在 


伯 德 必须 在 前 两 次 投篮 


1 一 p)(1 一 9). 类 似 地 , 如 果 n= 3, 那么 拉 昌 
| 均 失 网 而 魔术 师 约 翰 逊 的 前 两 次 投篮 也 要 失败 , 并 县 
有 件 发 生 的 概率 为 (1 


拉 里 ” 伯 德 在 第 三 次 投篮 
gq)p = 72p. 概括 来 说 ， 


PD)(1 — (1 


结果 , 而 且 考 虑 到 
那么 


是 


“ 拉 里 


里 的 7 与 前 面 


样 


中 r= (1 一 p)(1 一 9). 


接 下 来 , 在 不 使 用 几何 级 


理 日 


J 以 推导 出 


这 个 公式 的 另 一 


一 利 


= (1 一 p)(1 一 gq). 利 月 


Fh 不 同 于 之 前 的 方式 来 计算 


为 p), 那么 他 就 获得 了 胜利 . 由 定义 可 


伯 德 获胜 ”的 概率 =p 十 rp 十 7?p 十 73p 十 … 


数 公 


的 概率 为 r"-1p. 注意 ,7 的 指数 是 n 一 1, 为 了 在 
前 n 一 1 次 投 复 都 必须 失败 , 而 第 n 次 投篮 必须 成 功 . 
伯 德 的 获胜 概率 分 解 成 了 (无 限 多 个 ! ) 更 简单 的 概 
i 复 计算 任何 一 利 
日 德 获胜 ， 
的 概率 


一 定 存在 某 个 n, 使 得 他 首次 命中 发 生 在 


几何 级 数 公式 计算 这 个 概率 可 得 
胜 ” 的 概率 = 本， 
be 


\ 式 的 前 提 下 推导 这 个 概率 . 


p)(1 


胜 的 各 种 可 
EF 第 n 


了 拉 里 ” 伯 德 获 


事实 上 , 利用 概率 推 


种 证 明 . 我 们 
知 , 这 个 事件 发 9 


用 xz 表示 拉 旭 


白 德 第 一 次 投篮 成 功 了 (发 生 的 概率 


伯 德 获胜 的 概率 ， 


并 用 


日 


E 的 概率 为 p. 如 果 拉 里 1 
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德 在 第 一 次 投篮 时 失败 了 (发 生 的 概率 为 1 一 p), 那么 他 可 能 获胜 的 唯一 方法 就 是 
魔术 师 约 翰 逊 在 第 一 次 投篮 时 也 没有 成 功 , 这 种 情况 发 生 的 概率 为 1 - 9. 显然 , 在 
魔术 师 约翰 逊 不 失手 的 情况 下 , 拉 里 ” 伯 德 不 可 能 获胜 ; 但 是 魔术 师 约 翰 逊 的 失败 
并 不 足以 保证 拉 里 ” 伯 德 能 够 获得 胜利 . 

现在 我 们 看 到 一 个 非常 有 趣 的 局 面 . 拉 里 _ 伯 德 和 魔术 师 约翰 逊 的 第 一 次 投 
篮 都 失败 了 , 而 拉 里 “ 伯 德 马上 又 要 开始 投 第 二 球 . 由 此 可 以 看 出 一 点 , 如 果 x 是 
拉 里 ” 伯 德 首次 成 功 时 的 获胜 概率 , 那么 在 已 知 拉 里 ” 伯 德 和 魔术 师 约 翰 进 的 第 一 
次 投篮 都 失败 的 前 提 下 , 拉 里 ” 伯 德 能 获胜 的 概率 仍 是 x. 这 是 因为 投 纂 竞赛 的 某 
个 结果 是 如 何 达 成 的 并 不 重要 . 只 要 拉 里 ” 伯 德 在 投篮 , 那么 不 管 他 和 魔术 师 约 输 
壕 已 经 失败 过 多 少 次 , 在 我 们 的 模型 里 他 获胜 的 概率 始终 是 一 样 的 . 这 是 一 个 无 记 
忆 进 程 的 例子 . 唯一 重要 的 就 是 我 们 处 于 什么 状态 , 而 不 是 我 们 如 何 到 达 那 里 . 

令 人 惊奇 的 是 , 我 们 现在 可 以 求 出 拉 里 ” 伯 德 获胜 的 概率 z! 回顾 x = (1 一 
P)(1 一 9), 可 以 看 到 这 个 概率 就 是 p 十 (1 一 p)(1 一 9)zx, 或 者 


地 


z=p+(1—7p)(l— qz 


现在 , 我 们 用 两 种 不 同 的 方法 计算 了 拉 里 ” 伯 德 获胜 的 概率 : 第 一 种 方法 利用 
了 几何 级 数 , 第 二 种 方法 用 到 了 无 记忆 进程 . 由 于 这 两 种 表述 一 定 是 等 价 的 , 所 以 
如 果 让 两 个 答案 相等 , 那么 就 会 发 现 这 也 证 明了 几何 级 数 公式 : 


因为 2 
赂 三 必 
其 中 p 关 0! 在 数学 论证 中 , 你 必须 时 刻 小 心 被 零 除 . 例如 , 当 p = 0 时 4p = 9p, 但 
这 并 不 意味 着 4 = 9. 当然 , 如 果 p = 0, 那么 拉 里 ” 伯 德 就 没有 获胜 的 机 会 , 我 们 
也 没 必要 考虑 这 个 计算 . 通过 选择 恰当 的 p 值 和 g 值 (参见 习题 1.5.30), 可 以 证 明 
关于 7 的 几何 级 数 , 其 中 > 是 满足 0 入 r <1 的 任意 值 . 
这 是 概率 论 中 最 重要 的 方法 之 一 ; 事实 上 , 这 也 是 我 们 把 这 个 问题 放 在 引言 中 
的 原因 之 一 . 我 们 会 经 常 遇 到 些 非常 困难 的 计算 , 但 如 果 够 聪明 , 我 们 就 会 看 到 
它 等 于 某 些 更 容易 求解 的 东西 . 当然 , 我 们 很 难 “ 看 到 ”这 种 更 简单 的 方法 , 但 做 的 
题目 越 多 就 越 容易 看 到 它 . 我 们 称 之 为 比较 证 明 法 (Proof by Comparison) 或 者 故 
事 证 明 法 (Proof by Story), 并 会 在 A.6 节 中 给 出 更 多 的 例子 和 解释 
计算 拉 里 ” 伯 德 获胜 概率 的 第 三 种 方法 之 所 以 有 效 , 是 因为 我 们 有 如 下 形式 的 


未 知 量 = 已 知 量 + c :未 知 量 ， 


S 
她 
2 
ml 


这 里 只 要 求 c 产 1 我 们 必须 排除 c= 1 的 情况 , 否则 在 方程 的 两 端 会 同时 出 现 一 
样 的 未 知 量 , 这 意味 着 我 们 无 法 将 未 知 量 分 离 出 来 . 但 如 果 c。 关 1, 那么 我 们 就 能 求 
出 “未 知 量 = 已 知 量 /(1 一 0)”. 

例 1.2.1 ( 代 回 法 求 积分 ) 在 微 积分 中 ,，“ 代 回 法 ”是 人 们 非常 熟悉 的 一 种 方 
法 , 用 来 计算 某 些 积 分 值 . 它 的 基本 思想 是 , 通过 计算 使 得 方程 两 端 同 时 含有 未 知 
积分 , 然后 解 方程 求 出 积分 值 . 例如 , 考察 


nT 
全 |) ec cos zdz. 
0 


我 们 进行 两 次 分 部 积分 . 令 w= ecz, dv = coszdz, 于 是 du = ceczdz 且 vw = sinx. 
为 局 udv = wvl8 一 广 vdu, 所 以 


nT nT 
. 区 。 
了 一 ec sin z|。 一 下 ce®” sin zdz = -cf ec sin zdz. 
0 0 


现在 第 二 次 使 用 分 部 积分 . 于 是 , 再 次 令 凡 = ecz, dv = sinzdz, 进而 有 dw = ceczdz 
和 w= 二 一 cosx. 那么 


区 
大 二 -cf ec sinzdz 
0 


一 1 ce””(— cos dz 
0 Jo 


nT 
一 一 C | 十 1 十 -| e@® cos oaz| 
0 


一 一 C ec cosZz) 


Tn 
一 一 cerc ce ecz cosZdz = -cerc —c— el. 
0 


最 后 一 个 积分 就 是 我 们 要 算 的 工 整理 上 式 可 得 


T+ce*T=—ce™— oe, (1.2) 
或 者 
Ce“ 十 C 
pe e COs Xd7 = 一- 一. 
0 c* 十 1 


这 是 一 种 非常 好 的 方法 一 一 不 直接 计算 积分 , 而 是 让 这 个 积分 等 于 某 个 已 知 量 与 
其 倍数 之 差 . 

注 1.2.2 每 当 看 到 像 式 (1.2) 那样 的 复杂 表达 式 时 , 都 应 该 验证 一 下 其 参数 
的 特殊 情形 . 这 是 检验 我 们 是 否 犯 错 的 一 个 好 方法 . 比如 , 当 c > 0 时 最 终 的 答案 
是 负 的 , 你 是 不 是 有 点 吃惊 ? 当 z < nx/2 时 余弦 函数 是 正 的 , 但 当 了 在 /2 和 区 之 
间 取 值 时 余弦 函数 就 变 成 了 负 的 , 而 且 ec* 是 个 单调 增加 的 函数 . 那么 , 当 指数 取 
值 较 大 时 就 会 有 一 个 负 项 产生 , 而 整个 表达 式 也 应 当 是 负 的 . (老实 说 , 在 写 这 个 问 
题 时 我 原本 丢掉 了 一 个 负 号 , 后 来 通过 验证 才 发 现 了 这 个 错误 ! ) 另外 一 个 不 错 的 
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验证 方法 是 让 c= 0. 此 时 有 [Vcoszdzx, 它 的 值 为 0. 这 正 是 式 (1.2) 在 c= 0 时 的 
结果 . 

注 1.2.3 (几何 级 数 公式 的 证 明 ) 为 了 保持 完整 性 , 我 们 给 出 几何 级 数 公式 的 
标准 证 明 . 考虑 S, = 二 1 十 7 十 站 十 … 十 77. 注意 到 75% = 了 十 r2 十 7r3 十 .十 rn+l， 
于 是 5 一 75% 二 1 一 rn+l, 或 者 


] _ rn+l 
SN 二 
1—r 
如 果 |r| <1, 那么 令 n 一 co, 可 得 
lim 5, 人 1 
信 一 CO 二 人 


我 们 乘 上 r 的 原因 是 , 这 样 能 使 两 个 表达 式 中 的 项 几乎 完全 相同 . 当 我 们 做 减 
法 时 ,几乎 所 有 的 项 就 都 被 消 掉 了 .通过 实践 ， 我 们 可 以 更 容易 地 看 出 进行 什么 样 
的 代数 运算 会 导致 极 大 的 简化 , 但 这 正 是 课题 中 最 困难 的 部 分 之 一 . 

注 1.2.4 ”从 技术 角度 上 看 , 我 们 给 出 的 几何 级 数 的 概率 证 明 并 不 像 标准 证 明 
那么 好 . 原因 在 于 , 7 = (1 一 p)(1 一 g) 会 迫使 我 们 取 7 > 0. 另 一 方面 , 标准 证 明 却 
允许 我 们 取 绝 对 值 不 大 于 1 的 任何 7. 通过 一 些 额外 的 工作 , 我 们 可 以 进一步 推广 
论证 , 从 而 使 + 取 负 值 的 情形 也 能 得 到 处 理 . 令 7 = 一 s, 其 中 s >>0, 那么 


>》 (-5” 》、 区 YS 3 > a 
n=0 n=0 6 5 
现在 把 几何 级 数 公式 应 用 到 sz = (s?)”" 的 和 上 , 得 到 
= 和 1 Ce 1—s 1 四 1 
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n=0 
这 与 我 们 上 面 所 说 的 一 致 . 我 们 所 做 的 一 切 似乎 都 只 是 一 些 巧妙 的 代数 运算 , 但 很 
多 数学 领域 都 在 研究 如 何 重 写 代数 表达 式 来 消除 混乱 并 弄 清楚 到 底 发 生 了 什么 . 这 
个 例子 表明 了 , 我 们 通常 可 以 先 证 明 一 个 简单 情形 下 的 结果 , 然后 再 做 一 点 工作 就 
能 得 到 更 一 般 的 结果 . 

注 1.2.5 ” 当 所 学 的 数学 知识 越 来 越 复杂 时 , 你 就 会 意识 到 好 的 符号 表示 能 带 
来 巨大 的 帮助 . 在 概率 论 中 ,通常 用 4 来 表示 互补 概率 1 - p. 然而 , 在 这 个 问题 上 
我 们 使 用 p 和 字母 表 中 的 下 一 个 字母 g 来 表示 我 们 最 关心 的 两 个 概率 : 拉 里 伯 
德 的 投篮 命中 率 以 及 魔术 师 约翰 进 的 投篮 命中 率 . 可 以 用 pB 来 表示 拉 里 ” 伯 德 的 
命中 率 ,用 pnt 表示 魔术 师 约 翰 进 的 命中 率 ; 虽然 这 现在 看 起 来 有 点 复杂 , 但 优点 
是 更 具 描述 性 : 在 阅读 下 文 时 , 我 们 能 清楚 地 知道 它们 描述 的 是 什么 . 按照 这 种 思 
路 , 我 们 可 以 把 拉 里 ” 伯 德 的 获胜 概率 写成 zB, 而 不 是 z. 就 这 个 简单 的 问题 而 言 ， 
这 一 点 并 不 值得 一 提 , 但 从 长 远 来 看 是 值得 考虑 的 事情 . 


1.2.2 ”相关 问题 


我 们 解决 篮球 问题 时 所 采用 的 技巧 可 以 应 用 于 很 多 其 他 情形 , 下 面 给 出 两 个 不 
错 的 例子 . 第 一 个 很 好 地 介绍 了 生成 函数 , 第 19 章 将 对 生成 函数 展开 详细 的 讨论 . 

例 : 代 回 法 的 另 一 个 有 趣 例子 是 ， 令 表示 第 n 个 斐 波 那 契 数 ， 计 算 
和 >_ ,有 瓦 /3” 的 值 . 
回想 一 下 , 斐 波 那 契 数列 是 由 递 推 关 系 P42 = F411 十 Fn 来 定义 的 , 其 初始 条 
件 为 而 =0 和 而 =1. 一 旦 序列 中 的 前 两 项 被 指定 , 那么 其 余 项 就 由 递 推 关 系 唯 
一 地 确定 . 当 我 们 研究 第 23 章 中 的 轮 盘 赌 策略 时 , 会 再 次 看 到 递 推 关系 . 

现在 用 我 们 的 方法 来 解决 这 个 问题 . 令 z = 0 Fn/3”. 在 下 面 的 论证 中 , 我 
们 将 对 求 和 下 标 进行 重新 整理 , 以 便 使 用 斐 波 那 契 数列 的 递 推 公式 . 使 用 这 个 关系 
并 不 奇怪 , 因为 它 是 斐 波 那 契 数 的 定义 属性 . 我 们 有 
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由 于 而 = 0, 可 以 把 最 后 一 行 的 第 一 个 和 式 写 成 n 从 0 到 oo 的 形式 , 于 是 
加 i 
Wr 


这 表明 了 x = 3/5. 
这 很 烦人 , 但 在 像 上 面 这 样 的 问题 中 , 你 必须 改变 求 和 下 标 , 让 它 产生 点 变动 . 
如 果 继 续 学 习 微 分 方程 , 那么 当 学 到 级 数 解 时 , 你 就 会 不 停 地 做 这 件 事 . 关于 这 种 
方法 的 另 一 个 例子 , 请 参阅 A.2.3 节 中 二 项 式 定理 的 证 明 . 

例 : 我 们 再 举 一 个 例子 . Alice、Bob 和 Charlie( 如 果 学 习 密 码 学 课程 , 那么 
你 就 会 再 次 与 他 们 相 见 ) 正在 玩 纸牌 游戏 . 第 一 个 拿 到 方块 牌 的 人 获胜 . 他 们 轮流 
抽 牌 一 一 Alice 先 抽 , 之 后 是 Bob, 接 下 来 是 Charlie, 然后 又 是 Alice, 依 此 类 
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推 一 一 直到 有 人 抽 到 方块 牌 为 止 . 当 一 个 人 抽取 之 后 , 如 果 他 拿 到 的 牌 不 是 方块 ， 
则 将 其 放 回 整 副 牌 里 , 并 在 下 一 个 人 抽取 之 前 重新 彻底 洗 牌 . 每 个 人 获胜 的 概率 是 


: 我 希望 下 面 的 论证 看 起 来 是 可 信 的 . 起 初 我 以 为 是 这 样 , 但 它 却 导 致 了 
共生 1 在 概述 它 之 后 , 我 们 会 分 析 问 题 出 现在 哪里 ， 当 你 阅读 下 文 时 , 看 看 


六 小 


$$ z 表示 Alice 获胜 的 概率 , y 表示 Bob 获胜 的 概率 , z 表示 Charlie 获胜 的 概 
率 . 因为 一 副 牌 共 有 52 张 , 其 中 13 张 是 方块 , 所 以 无 论 谁 拍 牌 ,他 能 抽 到 方块 的 概 


率 都 是 13/52 = 1/4. 那么 , Alice 获胜 的 概率 就 是 
1 333 
4 44 4 


或 者 x = 于 + 芭 z, 这 表明 了 加 z = + 或 x = 其 .为 什么 是 这 个 答案 昵 ? 为 了 
使 Alice 获胜 , 要 么 Alice 第 一 次 抽 牌 就 获胜 了 , 这 个 事件 发 生 的 概率 是 1/4; 要 么 
Alice、Bob 和 Charlie 的 第 一 次 抽 牌 都 没有 成 功 , 这 种 情况 发 生 的 概率 为 (3/4)3. 从 
这 一 点 上 来 看 , 就 好 像 我 们 刚 开 始 玩 游戏 一 样 . 现在 你 应 该 看 到 这 个 问题 与 篮球 问 
题 的 相似 之 处 了 . 

同样 , 我 们 发 现 Bob 获胜 的 概率 是 


一 了 

也 就 是 说 , 要 么 Bob 在 第 一 次 抽 牌 时 获胜 ; 要 么 所 有 人 第 一 次 抽 牌 都 失败 了 , 接 下 

来 Alice 又 没 抽 到 方块 , 然后 Bob 又 开始 抽 牌 . 整理 上 述 代 数 表 达 式 可 得 y = 仿 . 

如 果 对 Charlie 进行 类 似 的 论证 , 我 们 会 得 到 > = 二 . 

像 往常 一 样 , 检查 答案 是 非常 有 意义 的 . 由 于 他 们 当中 恰好 必 有 一 人 获胜 , 因 

此 x 十 y 十 Zz 二 1 一 定 成 立 . 虽然 可 以 直接 利用 x 和 求 出 z, 但 我 们 更 喜欢 上 面 这 

种 方法 , 因为 它 为 我 们 提供 了 检验 答案 的 机 会 . 只 要 有 可 能 , 你 就 应 该 尝试 用 两 种 

不 同 的 方法 来 寻找 答案 , 以 防 出 现代 数 (或 者 其 他 更 严重 的 ) 错误 . 在 这 个 例子 中 ， 
我 们 有 
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那么 , 到 底 出 了 什么 问题 ? 这 些 概率 之 和 应 该 是 1, 但 实则 不 是 ; 我 们 的 结果 发 
生 了 偏离 . 问题 出 现在 我 们 没有 正确 地 计算 概率 . 我 们 把 y 定义 为 , 当 Alice 先 抽 
牌 时 , Bob 能 获胜 的 概率 . 因此 , 关于 y 的 等 式 并 不 是 y = 3. 1+ (3)*y, 而 是 


3 3 
tg G) y 
记 住 , y 是 在 Alice 先 抽 牌 的 前 提 下 , Bob 获胜 的 概率 . 所 以 , 当 我 们 重新 开始 游戏 
时 , 一 定 是 Alice 在 抽 牌 , 而 不 是 Bob. 为 了 更 加 明确 , 我 们 来 看 一 下 上 面 的 两 项 . 


Z 十 y 十 2 三 
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3 .3 来 自 Alice 先 抽 牌 且 没 有 抽 到 方块 , 而 紧 随 其 后 的 Bob 抽 到 了 方块 . 由 于 vy 是 
在 Alice 先 抽 牌 的 前 提 下 Bob 获胜 的 概率 , 因此 我 们 需要 回 过 头 来 考察 Alice 的 抽 


牌 情况 . 于 是 , 在 第 二 项 中 ， 
到 方块 牌 . 从 这 一 点 开始 , 又 轮 到 Alice 
就 是 y. 
得 到 z= 喝 . 注意 z+T2yT+z= 吉 十 莫 1 
另外 , 一 旦 知道 


我 们 


是 值 


单 : 如 果 计 算 Bob 


率 束 


9, = 
37 1. 
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可 以 求 出 > = 


2 
4 


了 z, 就 可 以 直接 通过 y = az 来 
获胜 的 概率 , 那么 Alice 就 肯定 不 会 
在 Alice 第 一 次 抽 牌 失败 后 , 就 该 Bob 抽 牌 了 . 然而 , 从 这 一 刻 
等 于 Alice 作为 第 一 个 抽 牌 人 的 获胜 概率 , 即 z. 于 是 y = 3z = 


37° 


我 们 需要 一 段 时 间 才 能 


的 项 


极其 


目 更 好 一 些 ! 


有 用 、 有 价值 的 技能 , 可 


新 审 


i 
经 党 


diamonddraw [num_] 


视 一 下 自己 的 错误 逻辑 , 并 写 


用 Mathematica 编程 ， 


得 的 . 如 果 能 准确 地 识别 无 记忆 的 部 分 , 那么 你 通 
程 . 在 你 的 “ 待 办 事项 (或 者 应 该 说 “ 求 和 ?>) 柬 
在 本 节 结束 之 前 , 我 们 建议 你 学 习 一 下 如 何 
性 


因数 (3)” 代 表 了 Alice、Bob 和 最 后 的 Charlie 都 没有 
| 牌 了 , 那么 从 此 刻 起 Bob 获胜 的 概率 


因此 y = .了 + (3)?y. 我 们 可 以 很 容易 地 求 出 y = 芭 . 按照 类 似 的 论证 可 以 


定 y. 从 直观 上 看 , 这 很 简 


E 她 的 第 一 次 抽 脾 中 获胜 . 


以 这 种 方式 看 待 


始 , Bob 获胜 的 概 
如 .类似 地 ， 


a 四 
问题 , 但 这 


常 就 可 以 绕 过 无 限 求 和 的 过 
| 表 中 , 有 限 数 量 的 项 目 要 比 无 限 多 


编写 简单 的 计算 机 代码 . 这 是 一 利 
FE 数 值 层面 上 探讨 问题 , 还 能 验证 数学 结果 . 我 们 重 
个 简单 的 程序 来 检验 我 们 的 答案 是 否 合理 . 我 
因为 (1) 它 是 免费 的 ; (2) 它 有 很 多 我 喜欢 的 预定 义 函 
数 ; (3) 它 是 个 相当 友好 的 环境 , 有 很 好 的 显示 选项 ; (4) 这 是 我 在 大 学 时 使 


:= Module[{}, 


三 


地 


用 的 . 


awin = 0; bwin = 0; cwin = 0; (* 把 获胜 计数 初始 化 为 0 *) 


For[n = 1, n <= num, n++, 


{ (x* 开始 对 n 的 循环 *) 


diamond = 0; 


While[diamond == 0， 


{ (* 开始 对 方块 (diamond) 的 循环 ， 直 到 有 人 抽 到 方块 为 止 *) 
(* 在 有 放 回 的 条 件 下 ， 为 三 名 玩家 各 随机 选 一 张 牌 *) 


(* 我 们 将 对 这 副 牌 排序 ， 
cl = RandomInteger[{1， 
c2 = RandomInteger [{1， 
c3 = RandomInteger [{1， 


从 而 使 前 13 张 都 是 方块 *) 
52}]; 
52}]; 
52}]; 


(* 如 果 有 一 个 人 拿 到 了 方块 ,那么 获胜 且 循 环 结束 *) 
If[ci <= 13 || c2 <= 13 || c3 <= 13, diamond = 1]; 
(* 胜出 者 的 获胜 计数 加 1 *) 


If [diamond == 1， 
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If[ci <= 13, awin = awin + 1,， 
If[c2 <= 13, bwin = bwin + 1,， 
If[c3 <= 13, cwin = cwin + 1]]] 
] ; (* 结束 diamond 等 于 1 时 的 if 循 环 *) 
}]; (* 结束 对 diamond 的 while 循 环 *) 
]]; (* 结束 对 n 的 循环 *) 


Print["Here are the observed probabilities from ", num, " games."]; 
Print["Percent Alice won (approx): ", 100.0 awin / num, "%."]; 
Print["Percent Bob won (approx): ", 100.0 bwin / num, "4."]; 
Print["Percent Charlie won (approx): ", 100.0 cwin / num, "%."]; 


Print["Predictions (from our bad logic) were approx ", 1600.0/37, 

" ", 4800.0/175, " ", 900.0/37]; 
J 

玩 了 100 万 次 游戏 之 后 得 出 如 下 结果 . 

。 Alice 获胜 的 概率 ( 约 等 于 ): 43.2202%. 

。 Bob 获胜 的 概率 ( 约 等 于 ): 32.4069%. 

。 Charlie 获胜 的 概率 ( 约 等 于 ): 24.3729%. 

。( 由 我 们 的 错误 逻辑 推出 ) 三 者 获胜 的 概率 分 别 约 等 于 43.2432%、27.4286% 
和 24.3243%. 
因此 , 虽然 我 们 对 Alice 获胜 的 概率 相当 有 信心 , 但 Bob 获胜 的 概率 却 似乎 有 
点 可 疑 . 通过 100 万 次 游戏 , 我 们 希望 得 出 的 结果 能 够 接近 正确 答案 . 在 学 习 中 心 
极限 定理 之 后 , 我 们 会 重新 计算 我 们 与 正确 答案 之 间 的 距离 . 

注 1.2.6 ”是否 记 得 我 们 是 如 何 得 到 yy 二 3x 以 及 sz 二 (3)? 的 ? 利用 这 个 结 

果 , 我 们 可 以 求 出 x. 由 于 有 人 获胜 , 因此 概率 之 和 为 1: 


ee A RN 
量 4 


从 而 x = 二 16/37! 我 们 之 所 以 能 够 如 此 轻易 地 求 出 z, 是 因为 这 里 有 大 量 的 对 称 性 . 
所 有 玩家 在 每 次 抽 牌 时 都 有 相同 的 获胜 机 会 ,在 篮球 问题 中 , 只 有 当 p 二 gq 时 , 这 
一 点 才 成 立 . 
1.2.3 ”一 般 问 题 的 解决 技巧 

我 们 通过 讨论 另 一 个 篮球 问题 来 结束 本 节 ， 这 个 问题 源 自 Yigal Gerchak 和 
Mordechai Henig 共同 撰写 的 一 篇 优美 文章 “篮球 大 战 : 策略 和 获胜 概率 ”( 参 见 
[GH]). 我 们 的 目标 并 不 是 利用 一 切 数学 知识 来 解决 这 个 问题 . 如 果 想 要 解决 方案 ， 
你 可 以 去 看 他 们 的 论文 . 我 们 的 目的 是 冰 释 如 何 解决 这 样 的 问题 . 分 析 新 事物 的 能 
力 是 一 项 非常 有 价值 的 技能 , 却 很 难 掌握 . 你 研究 的 问题 越 多 , 获得 的 经 验 就 越 多 ， 
也 就 越 能 自如 地 把 握 其 中 的 关联 . 你 会 发 现 , 一 个 新 问题 与 你 以 前 做 过 的 某 些 事 情 


有 共同 之 处 , 这 可 以 帮助 你 了 解 该 如 何 着 手 分 析 . 当然 , 你 掌握 的 问题 越 多 , 看 到 联 
系 的 机 会 就 越 大 . 我 们 的 目标 是 强调 一 些 好 的 方法 , 它们 可 以 用 来 研究 你 不 熟悉 的 
新 间 题 . 下 面 给 出 这 个 问题 . 

问题 有 N 个 人 在 打 篮 球 . 每 个 人 有 一 次 投篮 机 会 , 并 且 所 有 人 的 投篮 次 序 
是 固定 的 . 投篮 命中 时 , 距离 最 远 的 那个 人 获胜 . 如 果 你 是 第 个 投篮 的 人 , 那么 
你 就 知道 前 一 1 个 人 的 投篮 结果 , 还 知道 在 你 之 后 仍 有 多 少 人 投篮 .你 应 该 在 
哪里 投篮 ? 

与 本 章 中 的 诸多 问题 一 样 , 第 一 步 是 确保 我 们 理解 这 个 问题 . 我 们 会 用 几 个 假 
设 来 简化 问题 . 在 阅读 完 本 节 和 上 面 提 到 的 论文 之 后 , 如 果 你 仍 有 疑惑 , 就 试 着 删 
除 一 些 假设 并 找 出 新 的 解决 方案 . 

。 我 们 假设 所 有 篮球 运动 员 都 在 连接 两 个 篮 复 的 直线 上 投篮 . 你 可 能 认为 这 
是 个 自动 假设 , 因为 球员 们 是 在 没有 任何 防守 球员 施 压 的 情况 下 投篮 的 , 所 
以 全 部 的 投篮 结果 都 只 与 距离 有 关 . 但 是 , 这 种 论述 有 个 缺陷 : 球 可 以 从 篮 
板 上 弹 回来 , 因此 投篮 的 角度 或 许 也 很 重要 . 如 果 是 这 样 的 话 , 我 们 可 能 需 
要 详细 了 解 人 们 如 何 根据 篮 管 的 距离 和 角度 进行 不 同 的 投篮 . 因此 , 不 妨 想 
得 更 简单 点 , 假设 每 个 人 都 熙 在 同一 条 直线 上 投篮 . 
接 下 来 , 我 们 假设 所 有 的 球员 都 实力 相当 . 当然 , 这 并 不 现实 , 但 请 记 住 伟大 
的 忠告 ; 先 学 走 , 再 学 跑 ! 始终 先 试 着 考察 一 些 简单 的 情形 . 在 所 有 球员 的 
能 力 都 相同 的 前 提 下 , 如 果 我 们 解决 不 了 这 个 问题 , 那么 就 没有 机 会 处 理 一 
般 的 情况 . 
。 如果 两 个 人 在 同一 个 位 置 都 投篮 成 功 , 那么 会 有 什么 样 的 结果 ? 对 这 一 点 的 
萌 述 很 模糊 我们 可 以 说 , 先 投篮 成 功 的 人 获胜 . 在 这 种 情况 下 , 另 一 个 人 
绝对 不 可 能 在 同一 个 地 方 投篮 . 但 是 , 他 可 以 在 10-1 厘米 之 外 投篮 . 为 了 
避免 这 种 可 笑 的 动作 , 我 们 就 说 , 如 果 两 个 人 在 相同 的 位 置 投篮 , 那么 后 投 
篮 的 人 获胜 . 这 样 做 就 避免 了 限制 性 论证 , 也 不 会 真 的 从 根本 上 改变 解决 方 


案 . 


。 当 你 距离 篮 信 更 远 时 , 投篮 的 命中 率 不 会 增加 . 虽然 这 看 起 来 是 合理 的 , 但 
重要 的 是 要 意识 到 我 们 正在 做 出 这 样 的 假设 . 考虑 这 样 一 件 事 : 把 你 的 右手 
伸 向 天 空 . 试 着 用 右手 的 拇指 触摸 你 的 右 肩 . 现在 试 着 用 同一 个 拇指 触摸 你 
的 右 肘 . 当 手 臂 伸 展 的 时 候 , 手 肘 离 拇指 更 近 , 因此 假设 拇指 将 更 容易 触摸 
到 手 肘 似乎 是 合理 的 , 但 这 显然 不 是 事实 . 
。 现 在 反 过 来 看 , 我 们 假设 球员 可 以 非常 接近 篮 复 , 以 至 于 他 们 的 投篮 命中 率 
能 够 达到 100%. 这 是 一 个 非常 有 用 的 假设 . 为 什么 呢 ? 如 果 前 NN 一 1 个 球员 
都 失败 了 , 那么 最 后 一 个 球员 自然 会 尽 可 能 地 接近 复生 , 从 而 获得 胜利 .如 
果 这 种 情况 不 可 能 发 生 , 那么 在 比赛 中 可 能 就 没有 说 家 . 
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好 了 , 现在 是 解决 问题 的 时 候 了 . 因为 球员 的 实力 相同 , 所 以 我 们 不 用 英尺 或 


所 在 的 位 置 . 医 


增加 了 . 
然而 , 在 解决 这 个 问题 之 前 , 我 们 有 必要 花 点 时 间 来 思考 一 下 符号 . 我 们 需要 
对 给 定 的 信息 以 及 数学 方程 中 的 分 析 进 行 编码 . 符号 是 非常 重要 的 . 由 于 一 共有 N 


个 人 参加 比赛 , 每 个 人 的 命 


者 米 来 衡量 球员 与 篮 钞 之 间 的 距离 , 而 是 根据 他 们 投篮 的 命中 率 来 标记 他 们 投篮 时 
此 , 如 果 接 近 篮 做, 那么 p 就 应 该 接近 1; 再 向 前 移动 时 , p 就 不 再 


中 率 都 是 p, 并 且 所 有 人 都 在 他 们 的 最 佳 位 置 投篮 , 因此 


需要 用 一 个 符号 来 表示 1 号 球员 获胜 的 概率 . 我 们 用 zi;w(p) 来 表示 这 个 概率 . 为 


什么 


间距 离 的 函数 , 因此 把 它 写 成 
1 号 球员 , 第 二 个 则 告诉 我 们 一 共有 多 少 人 ， 因 为 这 两 个 数 扮演 着 不 同 的 角色 , 所 


以 用 分 号 阳 开 它们 . 我 们 并 不 ; 


使 用 这 个 符号 ? 我 们 经 常 / 


] zx 表示 未 知 量 . x 应 该 是 球员 投篮 的 位 置 与 篮 惫 之 
2 的 函数 是 合理 的 . 那么 下 标 呢 ? 第 一 个 下 标 指 的 是 


青 楚 第 二 个 球员 的 符号 应 该 是 什么 , 因为 他 投篮 的 位 


置 取 决 于 第 一 个 球员 的 投篮 位 


置 . 稍 后 再 讨论 这 个 问题 . 


有 了 这 个 符号 之 后 , 我 们 现在 来 计算 zi;n(p). 每 当 遇 到 难题 时 , 最 好 的 方法 就 
是 先 考察 一 些 简单 的 情形 , 并 从 中 找 出 规律 . 如 果 只 有 一 个 球员 , 那 结果 很 清楚 : 他 


获胜 了 ! 他 只 要 在 命中 率 为 100% 的 地 方 投篮 就 可 以 了 , 于 是 x1.1(1) = 1. 请 注意 ， 


妇 


如 果 只 有 一 个 球员 , 那么 我 们 绝 不 会 让 他 在 其 他 任何 地 方 投篮 . 
上 果 一 共有 两 个 球员 了 呢 ? 仔细 想 想 , 其 实 一 切 都 由 第 一 个 球员 的 投篮 位 置 决定 . 
如 果 第 一 个 球员 失败 了 , 那么 第 二 个 球员 会 自动 获胜 , 因为 正如 我 们 所 说 的 , 每 个 


第 二 个 球员 就 


球员 都 可 以 充分 接近 人 信 来 确保 投篮 成 功 .但 是 , 如 果 第 一 个 球员 投篮 成 功 , 那么 


会 站 在 同一 个 位 


置 投篮 (因为 我 们 已 经 声明 过 , 如 果 两 个 人 在 同一 位 


置 均 投 篮 成 功 , 那么 第 二 个 投篮 的 人 获胜 ). 
在 将 上 述 分 析 转 换 为 数 


学 符号 之 前 , 我 们 试 着 去 感受 一 下 这 个 解决 方案 . 这 是 


非常 有 价值 的 一 步 . 如 果 你 对 答案 有 一 个 大 致 的 了 解 , 那么 就 更 容易 发 现 其 中 的 代 


数 错误 . 首 儿 


E 要 问 的 问题 是 : 第 一 个 球员 的 获胜 概率 是 大 于 50% 还 是 小 于 50%? 另 
种 说 法 是 : 你 选择 先 投篮 还 是 后 投篮 ? 对 我 来 说 , 我 宁愿 第 二 个 投篮 . 如 果 第 一 
个 球员 失败 了 , 那 我 就 自动 获胜 ; 如 果 他 投篮 命中 , 那 我 要 做 的 就 是 在 同一 个 位 置 
因此 , 似乎 有 理由 认为 z1.2(p) < 1/2. 


我 们 假设 第 一 个 球员 在 位 置 p 处 投篮 ( 记 住 , 这 意味 着 他 在 此 处 的 投篮 命中 率 
为 p), 有 两 种 可 能 的 情况 . 

(1) 第 一 个 球员 投篮 成 功 (发 生 概 率 为 p), 紧 接 着 第 二 个 球员 投篮 . 此 时 , 第 二 
个 球员 的 投篮 命中 率 为 p. 那么 在 这 种 情况 下 , 第 一 个 球员 获胜 的 概率 就 是 1 一 p. 

(2) 第 一 个 球员 投篮 失败 (发 生 概率 为 1 - p), 那么 第 二 个 球员 就 以 概率 1 投 
篮 成 功 . 于 是 第 一 个 球员 获胜 的 概率 就 是 0. 


把 这 两 利 


情况 结合 起 来 , 可 得 


2Zl2(D) =p:(1—p)+(1—7p):0= 7(1— 7). 


现在 , 我 们 想 找 到 能 使 上 述 表达 式 取 到 最 大 值 的 p, 它 将 告诉 我 们 第 一 个 球员 
应 该 在 哪里 投篮 . 如 果 你 了 解 微 积分 的 知识 , 就 可 以 求 这 个 表达 式 的 导数 , 并 让 导 
函数 等 于 0. 这 样 就 可 以 得 出 当 p = 1/2 时 上 述 表达 式 能 取 到 最 大 值 . 另外 , 你 还 
可 以 绘制 函数 x1,2(p) = p(1 一 p) 的 图 像 . 这 是 一 条 向 下 的 抛物 线 , 其 顶点 在 
p= 1/2 处 , 因此 概率 的 最 大 值 为 1/4, 即 25%. 注意 , 我 们 的 答案 小 于 50%, 这 与 预 
期 一 致 . 
我 们 把 剩 下 的 分 析 留 给 读者 . 强烈 建议 你 考察 共有 三 个 球员 的 情形 . 有 些 问 题 
的 难度 不 会 随 着 N 的 增加 而 增加 太 多 ; 但 对 于 其 他 一 些 问题 , 一 些 新 特性 会 伴随 
着 NN 的 增加 而 出 现 . 即便 只 有 三 个 球员 , 想 要 找到 好 的 符号 也 很 困难 . 例如 , 第 二 
个 球员 的 投篮 位 置 取 决 于 第 一 个 球员 投篮 是 否 成 功 ， 这 个 结果 确实 带 来 了 一 个 好 
消息 : 如 果 第 一 个 球员 投篮 失败 , 那么 问题 就 归结 为 我 们 刚才 讨论 的 两 个 球员 的 情 
形 . 在 学 习 过 程 中 , 我 们 会 经 常 看 到 这 样 的 情况 , 你 应 该 时 刻 注意 简化 , 把 问题 化 为 
更 早 和 更 简单 的 情形 . 

在 本 节 结 束 时 , 我 们 明确 地 提出 了 一 些 关 于 如 何 处 理 新 的 困难 问题 的 有 用 方 
法 . 


-二 


一 般 问 题 求 解 策略 
。 清 晰 地 定义 问题 . 小 心 隐 藏 的 假设 . 内 容 要 明确 ; 如 果 需 要 提出 假设 , 那 
就 去 做 , 但 要 注意 事实 情况 . 
。 选择 合适 的 符号 . 我 一 直 被 “ 余 割 是 正弦 的 倒数 ” 押 困 扰 一 一 余 割 不 应 
该 和 余 粥 相对 应 吗 ? 在 微 积分 中 , 我 们 用 FF 来 表示 f 的 不 定 积分 , 这 种 
做 法 能 使 内 容 一 目 了 然 , 还 能 让 我 们 了 解 发 生 了 什么 . 


。 通过 考察 一 些 特殊 情形 来 建立 对 问题 的 直观 感觉 . 先 学 走 , 再 学 跑 . 不 要 
试图 一 次 性 解决 整个 问题 , 要 先 试 着 考察 一 些 简单 的 情形 , 并 从 中 找 出 规 
律 . 


1.3 赌 博 


如 果 没 有 讨论 过 概率 论 在 赌博 上 的 应 用 , 那么 对 概率 论 的 介绍 就 是 不 完整 的 . 
这 既 有 历史 原因 (推动 这 门 学 科 发 展 的 主要 动力 来 自 于 对 博弈 游戏 的 研究 ), 也 有 
对 当前 应 用 的 考虑 ( 想 一 想 从 足球 到 扑克 牌 再 到 选举 的 所 有 赛事 , 有 多 少 亿美 元 被 
人 们 下 注 、 输 掉 和 赢得 了 ). 


1.3 赌 博 29 


1.3.1 ”2008 年 超级 碗 赌注 


我 是 在 2008 年 夏天 来 到 威廉 姆 斯 学 院 的 . 我 最 喜欢 的 


(我 们 称 他 为 Bob) 的 故事 . 2007 年 , 他 在 拉 斯 维 加 斯 下 了 500 美元 的 赌注 , 称 爱 国 


一 个 学 生 讲述 了 他 朋友 


者 队 会 在 常规 赛 中 不 败 , 继续 赢得 超级 碗 冠军 . 他 获得 了 1000 比 1 的 赔 率 . 所 以 如 
果 他 赢 了 , 就 能 带 走 500 000 美元 ; 但 如 果 输 了 , 他 将 损失 500 美元 . 
这 个 赛季 的 情况 还 不 太 好 说 (2015 年 战胜 海 鹰 队 之 后 的 比赛 会 更 明朗 些 ), 但 


作为 爱国 者 队 的 球迷 , 我 仍 愿意 试 一 试 . 爱国 者 队 在 常规 赛 中 保持 不 败 , 成 为 第 一 


支 在 16 个 赛季 中 均 获 得 胜利 的 球 队 . 他 们 在 美 联 季 后 赛 


获得 胜利 , 并 进入 超级 


碗 比赛 , 面 对 的 是 纽约 巨人 队 . 虽然 爱国 者 队 在 常规 赛 最 后 一 场 比赛 中 击败 了 巨人 


队 , 但 这 是 场 势 均 力 敌 的 比赛 . 


在 比赛 第 3 节 的 中 段 ， 爱 国 者 队 以 微弱 优势 领先 ,， 拉 


斯 维 加 斯 打 电 话 给 Bob， 


并 提出 以 300 比 工 的 赔 率 买 入 . 这 意味 着 他 们 会 给 Bob 150 000 美元 来 避免 遭受 


更 大 的 损失 . 因此 , 如 果 Bop 接受 了 , 那么 拉 斯 维 加 斯 就 会 马上 损失 150 000 美元 ， 


但 可 以 避免 损 
失去 了 获得 500 000 美元 的 机 会 . 


更 大 的 500 000 美元 ; 同样 , 这 意味 着 Bob 得 到 了 150 000 美元 却 


Bob 对 爱国 者 有 信心 , 拒绝 了 他 们 的 提议 , 选择 了 大 回报 . 我 想 说 , 同时 也 希望 
能 说 服 你 , Bob 做 了 一 个 糟糕 的 选择 . 然而 , Bob 做 出 错误 选择 的 原因 与 巨人 队 接 


球 手 大 卫 ” 泰 里 惊人 的 头盔 接 球 并 没有 任何 关系 , 正 是 这 


点 使 得 巨人 队 在 记得 巨 


大 胜利 的 道路 上 充满 胜算 . Bob 的 处 境 十 分 危险 : 如 果 爱 国 者 队 获 胜 , 他 就 能 说 得 
大 回报 ; 但 如 果 爱 国 者 队 输 了 , 他 就 什么 也 得 不 到 . 在 下 个 小 节 中 , 我 们 将 考虑 Bob 
如 何 最 大 限度 地 降低 自己 所 面临 的 风险 . 事实 上 , 只 要 应 用 一 点 点 概率 知识 , 无 论 


谁 赢 得 这 场 比赛 , Bob 都 可 以 确保 得 到 几 十 万 美元 ! 
1.3.2 ”预期 收益 


现在 Bob 已 经 把 500 美元 押 在 了 爱国 者 队 上 . 


如 果 爱 国 者 获胜 , 他 将 获得 


500 000 美元 的 收入 , 但 如 果 他 们 输 了 , Bob 将 一 无 所 有 . 如 果 爱 国 者 队 获胜 的 概率 


且 , 不 管 怎样 , 他 都 失去 了 500 美元 的 赌注 . 


是 p, 那么 Bob 赚 500 000 美元 的 概率 就 是 bp, 而 他 赚 0 美元 的 概率 就 是 1 一 p; 而 


对 Bob 来 说 , 问题 在 于 他 正 处 在 一 个 非常 危险 的 境地 : 根据 比赛 的 结果 , 他 的 
个 人 财富 可 能 会 产生 巨大 的 波动 . 他 可 以 通过 二 次 下 注 并 把 赌注 押 在 巨人 队 上 来 保 


护 自 己 . 如 果 他 在 赛季 初 就 下 了 保护 性 的 赌注 , 那么 回 


报 的 计算 方法 会 让 他 陷入 困 


境 , 但 现在 Bob 正 处 于 一 个 幸运 的 位 置 (遗憾 的 是 他 章 


是 在 赛季 初 一 一 爱国 者 队 已 经 进入 了 超级 碗 比赛 , 我 人 


F 没 有 意识 到 这 一 点 ). 我 们 不 
] 知 道 他 们 的 对 手 是 谁 . Bob 


现在 可 以 通过 投注 巨人 队 来 保护 自己 . 作为 一 个 爱国 者 队 的 球迷 , 我 能 理解 他 不 愿 


意 这 样 做 ; 然而 , 从 一 名 数学 家 的 角度 看 , 这 是 唯 


明智 的 决定 ! 


想象 一 下 , 对 于 投注 在 巨人 队 上 的 每 1 美元 , 如 果 巨 人 
美元 ; 如 果 他 们 输 了 , 你 会 得 到 0 美元 ; 当 爱 国 者 队 有 望 获 朋 
什么 ? 假设 这 两 个 队 势 均 力 敌 , 每 队 获 胜 的 可 能 性 各 占 一 半 . 


队 忆 了 ,你 就 会 得 到 zx 
E 时 , z 一 定 大 于 2. 为 
那么 当 z = 2 时 , 如 果 


下 注 1 美元 , 我 们 就 有 一 半 的 机 会 得 到 2 美元 , 一 半 的 机 会 得 到 0 美元 , 因此 平均 
得 到 1 美元 . 请 注意 , 这 恰 与 我 们 下 注 的 金额 完全 相等 , 所 以 在 这 种 情况 下 不 应 该 


下 注 . 然而 , 当 爱 国 者 队 有 望 获胜 时 , 拉 斯 维 加 斯 就 需要 鼓励 人 们 向 巨人 队 投 注 . 当 
巨人 队 获 胜 的 概率 被 认为 不 到 50% 时 , 那么 为 使 赌局 更 加 公 


就 必须 有 更 大 的 回报 , 因此 x > 2. 


\ 平 , 如 果 巨 人 队 赢 了 ， 


为 了 更 加 明确 , 我 们 假设 爱国 者 队 获胜 的 概率 是 p = 0.8， 


日 x = 3, 并 假设 投注 


了 B 美 元 赌 巨人 队 赢 . 此 外 , 我 们 还 假设 超级 碗 比赛 将 不 断 进 行 下 去 , 直到 有 一 个 
队 获 胜 为 止 , 因此 这 里 没有 平局 . 如 果 你 不 喜欢 这 种 说 法 , 也 可 以 说 成 “爱国 者 队 
获胜 ”, 或 者 “爱国 者 队 没有 获胜 ”. 注意 , 没有 获胜 可 能 并 不 等 于 失败 . 我 们 的 回 


报 是 怎样 的 ? 如 果 爱 国 者 队 获 胜 (这 件 事 发 生 的 概率 是 p), 那 


美元 ; 如 果 巨 人 队 获 胜 (发 生 的 概率 是 1 一 yp, 我 们 就 赚 了 zB 美元 . 在 任意 一 种 情 


况 下 , 下 的 赌注 都 是 500 十 B 美元 . 
因此 , 我 们 的 预期 收益 为 
p: $500 000+ (1—p)z:$B— $500— $B 
我 们 把 它 绘 制 成 图 1-6. 
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图 1-6 “对 巨人 队 额 外 投注 B 美元 之 后 的 预期 收益 图 . 假设 爱国 者 队 有 80% 的 


Ox105 1.2x105 


机 会 获胜 , 如 果 巨 人 队 赢 了 , 投注 在 他 们 身上 的 每 1 
元 的 回报 


美元 可 以 获得 3 美 


注意 , 我 们 对 巨人 队 的 投注 越 多 , 预期 收益 就 越 低 . 这 并 不 奇怪 , 因为 我 们 假设 
爱国 者 队 获胜 的 概率 为 80%. 特别 是 , 如 果 我 们 在 巨人 队 上 的 赌注 数额 巨大 , 就 会 


1.3 赌 博 31 


损失 惨重 ( 


河 


尽 . 


1.3.3 ”对 冲 的 价值 


因 是 (1 一 p)z 小 于 1). 
起 初 , 在 巨人 队 上 投注 好 像 是 个 坏 主 意 一 一 投注 越 多 , 我 们 的 预期 收益 就 越 
低 ， 然 而, 在 下 一 小 节 中 , 我 们 将 继续 分 析 , 证 明 这 对 大 多 数 人 来 说 其 实 是 个 好 主 


只 有 


证 的 10 000 美元 , 还 是 概率 只 


图 1-6 具有 误导 性 . 没 错 , 我 们 对 巨人 队 下 的 赌注 越 多 , 预期 收益 就 越 低 ; 但 
是 , 这 种 说 法 是 有 问题 的 . 大 多 数 人 都 是 风险 规避 者 . 你 更 愿意 选择 哪个 : 是 有 保 


0.001% 的 100 万 美元 以 及 99.999% 的 概率 一 无 


所 有 ? 大 多 数 人 会 拿 稳 赚 的 10 000 美元 , 特别 是 当 你 计算 第 二 种 情况 下 的 预期 收 


益 时 : 虽然 有 0.001% 的 概率 获得 100 万 美元 , 但 除 此 之 外 一 无 所 有 . 因 


预期 收益 为 


0.000 01. $1 000 000 + 0.999 99 .$0 = $100. 


在 第 二 种 情况 下 , 如 果 我 们 能 启 , 则 一 定 会 赢得 
以 至 于 我 们 的 预期 收益 会 更 糟 . 
现在 , 如 果 我 们 在 第 二 种 性 


I 


大 


况 下 赚 到 的 不 是 100 万 美元 , 而 是 10 亿美 元 呢 ? 在 


此 , 我 们 的 


报 ; 但 这 件 事 发 生 的 概率 太 小 ， 


这 种 情况 下 , 预期 收益 将 从 100 美元 增加 到 100 000 美元 . 此 时 的 情况 就 不 太 好 说 
了 . 在 第 二 种 情况 下 , 期 望 值 会 更 大 , 但 绝 大 多 数 情况 下 我 们 什么 也 得 不 到 .我们 


应 该 接受 这 笔 交 易 吗 ? 这 个 问题 的 答案 超 


了 本 书 的 范围 , 还 涉及 经 济 学 和 心理 学 


领域 . 但 值得 一 提 的 是 , 这 对 我 们 来 说 并 没有 什么 意义 . 我 们 没有 机 会 玩 这 个 游戏 


很 多 次 , 而 是 只 能 玩 一 次 .…… 


虽然 上 述 问题 很 难 , 而 


涉及 个 人 选择 , 但 这 利 


这 种 情况 : 有 机 会 顾 得 大 回报 , 但 不 管 怎 术 


Fh 问 法 有 误 . 我 们 更 倾向 于 选择 
我 们 始终 能 保证 不 错 的 收益 . 一 般 来 说 ， 


这 是 不 可 能 的 , 但 Bop 是 幸运 的 , 他 的 情况 涉及 漂亮 的 对 冲 (hedging) 概念 . 最 难 学 
的 事情 之 一 就 是 问 正 确 的 问题 . 看 看 对 巨人 队 投 注 B 美元 之 后 的 预期 收益 图 , 我 们 
发 现 这 是 一 个 错误 的 研究 对 象 . 我 们 应 该 关注 , 对 巨人 队 的 B 美元 投注 能 够 


得 多 少 钱 . 


保证 赚 


尽管 这 两 个 问题 听 起 来 很 相似 , 答案 却 截然 不 同 . 如 果 我 们 对 爱国 者 队 和 巨人 


队 的 胜利 都 下 了 赌注 , 那么 不 管 谁 获 有 


了 , 我 们 会 得 到 500 000 美元 ; 如 果 
结果 如 何 , 我 们 都 失去 了 最 初 的 500 + B 美元 的 赌注 ). 因此 , 不 管 是 爱国 者 队 获胜 
到 500 000 美元 和 zB 美元 中 较 少 的 那个 . 图 1-7 展 


示 了 我 们 的 最 低 保证 收益 . 


图 1-7 与 图 1-6 有 很 大 不 同 : 当 我 们 增加 对 巨人 队 的 投注 时 , 最 低 收益 会 先 增 


还 是 巨人 队 获 胜 , 我 们 都 将 得 


加 , 然后 又 逐渐 减少 ! 我 们 的 最 低 收益 是 


FE, 都 至 少 有 一 个 赌注 会 说 . 如 果 爱 国 者 队 顾 
巨人 队 磋 了 , 我 们 会 得 到 zB 美元 ( 注 


FE 意 , 无 论 


min(500 000,zB) — 500 — B. 


假设 z = 3 且 p = 0.8, 我 们 发 现 最 关键 的 赌注 出 现在 500 000 = 3B, 即 B 约 等 于 
166 667 美元 时 . 在 这 个 特别 的 赌注 下 , 我 们 不 关心 (从 财务 角度 来 看 ! ) 到 底 是 谁 
获胜 , 此 时 我 们 确定 能 够 赚 取 约 332 833 美元 . 
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图 1-7 对 巨人 队 额 外 投注 B 美元 之 后 的 最 低 保 证 收益 图 . 假设 爱国 者 队 有 80% 的 机 会 获 
胜 , 如 果 巨 人 队 赢 了 , 投注 在 他 们 身上 的 每 1 美元 可 以 获得 3 美元 的 回报 


三 | 


这 值得 我 们 停 下 来 去 深入 思考 . 通过 在 巨人 队 上 押 下 一 大 笔 赌 注 (166 667 美 
元 对 我 们 大 多 数 人 来 说 可 不 是 个 小 数目 ! ), 我 们 可 以 确保 无 论 谁 赢得 比赛 , 最 终 都 
能 获得 332 833 美元 ! 此 时 , 我 们 就 不 是 在 赌博 了 , 因为 不 再 受 概 率 的 影响 ! 
1.3.4 ”结论 


关于 这 个 问题 还 有 很 多 可 以 说 的 , 但 目前 足以 突出 一 些 关 键 点 . 大 多 数 时 候 ， 
你 不 可 能 消除 所 有 的 风险 , 但 有 时 是 可 能 的 ! 为 什么 会 出 现 这 样 的 情况 ? 原因 是 我 
们 有 机 会 在 赛季 末 再 下 一 次 注 . (无 论 是 在 开赛 之 前 , 还 是 在 超级 杯 期 间 ! ) 

为 什么 Bob 没 能 做 到 这 一 点 ? 遗憾 的 是 , Bob 从 未 上 过 概率 论 课程 (与 Bob 以 
及 其 他 人 相 比 , 这 是 你 的 优势 ). 然而 , 从 心理 上 来 说 , Bob 专注 于 巨额 回报 , 说 得 巨 
大 的 赌注 . 他 如 此 专注 于 最 大 化 回报 , 以 至 于 完全 息 记 了 减少 损失 , 换 句 话说 , 就 是 
将 自己 的 最 低 收益 最 大 化 . 生活 中 很 容易 看 到 错误 的 东西 (魔术 师 都 是 很 棒 的 误导 
者 ), 本 书 的 目的 之 一 是 帮助 你 学 会 如 何 提出 正确 的 问题 , 并 关注 正确 的 数量 . 一 个 
很 好 的 例子 是 最 小 二 乘法 与 绝对 值 方法 (参见 第 24 章 ), 根据 什么 对 你 最 重要 , 可 
以 选择 不 同 的 “最 佳 ” 曲 线 来 拟 合 数据 . 

在 这 个 赌局 中 , 我 们 可 以 用 基本 的 概率 论 知 识 来 计算 预期 收益 . 我 们 看 到 , 如 


果 爱 国 者 队 获胜 的 概率 很 大 , 那么 从 最 大 限度 地 提高 预期 收益 的 角度 来 看 , 投注 巨 


人 队 是 毫 无 意义 的 . 然而 , 对 我 


门 大 多 数 人 来 说 , 这 是 错误 的 . 大 多 数 人 是 风险 规 


避 者 , 宁愿 得 到 有 保证 的 332 833 美元 , 而 不 是 可 能 的 500 000 美元 (期 望 价值 是 


400 000 美元 , 其 中 有 80% 的 可 能 赢得 


500 000 美元 , 有 20% 的 可 能 一 无 所 获 ). 非 


常 有 趣 的 是 , 谁 会 选择 哪 种 情况 具有 多 种 可 能 性 . 如 果 爱 国 者 队 获胜 的 概率 真 的 是 


80%, 那么 我 们 不 对 巨人 队 投注 的 预期 


收益 就 会 更 高 , 但 这 种 做 法 有 非常 大 的 风险 . 


对 我 来 说 , 如 果 对 一 大 笔 支 出 不 产生 任何 风险 , 得 到 较 少 的 预期 回报 是 值得 的 . 


有 趣 的 是 , 当 我 们 考察 最 低 收 益 


时 , 它 不 再 是 一 个 概率 问题 . 如 果 改 变 zx, 那么 


图 1-7 中 的 最 低 收益 就 会 发 生变 动 ; 然而 , 如 果 改 变 爱国 者 队 获胜 的 概率 p, 这 个 值 


就 不 会 变动 ! 为 什么 ? 原因 是 我 
此 无 论 谁 赢 , 我 们 始终 认为 结果 对 我 们 | 
在 学 习 数学 的 过 程 中 , 无论 是 方程 还 是 图 形 ,你 都 要 对 其 特性 有 一 定 的 了 解 
此 带 来 的 变化 . 例如 , 我 们 讨论 了 当 p 改变 时 


试 着 改变 一 些 参数 , 并 直观 地 感受 


门 现在 没有 考虑 预期 收益 , 只 考虑 了 最 低 收益 , 因 
来 说 是 最 糟 料 的 


将 会 发 生 什么 , 如 果 z 变 大 , 你 觉得 形状 会 发 生 什么 样 的 变化 ? 


我 希望 你 喜欢 这 些 问 题 . 


1.4 


总 结 


生日 问题 几乎 总 会 出 现在 概率 论 的 第 一 堂 课 上 (进行 


谷歌 搜索 很 快 就 会 出 现 上 亿 个 结果 ), 这 是 有 充分 理由 的 . 它 非 常 适合 引入 课程 . 它 


涉及 很 多 非常 重要 的 问题 , 包括 一 些 显 


而 易 见 的 问题 , 如 独立 性 的 概念 , 当 概 率 相 


乘 时 重复 计算 的 危险 , 以 及 遗漏 可 能 情况 的 风险 ; 另外 , 还 有 一 些 不 太 明 显 的 问题 ， 
例如 需要 清晰 地 陈述 问题 , 引入 新 函数 (如 阶乘 函数 ) 来 简化 表达 式 的 优点 , 取 对 数 


并 使 用 对 数 法 则 的 好 处 , 以 及 对 难以 计算 的 答案 求 近似 值 的 方法 . 


投篮 竞赛 并 不 那么 清晰 . 我 给 了 一 个 很 大 的 问题 , 涉及 斐 波 那 契 数 列 和 拉 斯 维 


加 斯 的 轮 盘 赌 策略 . 别 担心 , 我 们 


会 在 第 23 章 讲 到 这 些 内 容 . 关键 在 于 , 概率 论 教 


师 在 设计 课程 和 选择 例子 方面 有 很 大 的 自由 度 . 本 书 不 可 能 与 所 有 课程 完全 保持 一 


致 , 也 不 应 该 如 此 . 我 们 能 做 


讨论 如 何 检验 答案 , 并 明确 划 


的 就 是 详细 讨论 如 何 求解 一 个 问题 , 强调 使 用 的 技巧 ， 
中 的 危险 和 陷阱 . 这 些 东西 几乎 可 以 应 用 于 你 所 学 到 


的 任何 课堂 知识 .此 外 , 通过 选择 一 些 不 太 标 准 的 例子 , 你 会 看 到 一 些 令 人 感到 意 
外 的 东西 . 篮球 问题 很 快 为 我 们 引入 了 无 记忆 竞赛 的 概念 , 这 在 很 多 博 蛮 论 (以 及 


概率 论 的 高 级 课程 , 如 马尔 可 夫 过 程 ) 中 是 至 关 重 要 的 . 


如 果 你 之 前 学 过 微 积 分 ， 


那 就 有 了 


个 特殊 优势 , 重新 审视 那个 好 像 是 一 次 性 


的 技巧 (trick), 即 “ 代 回 法 ”, 这 个 方法 使 得 等 式 两 边 同 时 含有 未 知 积分 . 技巧 是 一 
这 就 是 个 很 棒 的 技巧 . 我 们 稍 后 会 详细 讨论 这 一 点 . 


种 可 以 反复 成 功 使 用 的 方法 ， 


我 们 有 很 多 赌博 问题 可 以 选择 . 我 选择 上 面 这 个 问题 的 原因 是 : (1) 我 是 爱国 


者 队 的 球迷 (虽然 2008 年 的 超级 碗 比赛 
特 勒 的 伟大 拦 


是 一 次 痛苦 的 失败 , 但 这 部 分 内 容 是 在 巴 


全 


算 和 爱国 者 队 获 得 2015 年 超级 碗 比赛 冠军 之 后 不 久 写 的 ); (2) 它 闸 


述 了 概率 论 的 应 用 以 及 概率 论 在 现实 生活 中 的 应 用 实例 ; (3) 它 提供 了 一 个 极 好 的 


机 会 来 讨论 如 何 提 昌 
通常 是 对 现成 例子 的 琐碎 修改 . 在 现实 生活 
么 , 或 者 衡量 成 功 的 标准 是 什么 . 我 们 所 关心 的 是 最 大 化 预期 收益 , 还 是 最 大 化 最 
低 收益 并 尽 可 能 减少 风险 ? 

现在 是 时 候 来 认真 地 探讨 这 门 课 了 . 我 们 必须 按照 章节 和 主 
们 的 选择 没什么 问题 , 但 你 要 意识 到 这 并 不 是 唯 
材 以 另 一 种 顺序 展开 ; 如 果 你 把 本 


FP, 最 难 的 部 分 往 旬 


三 < 过 
是 弄 清楚 


的 问题 . 以 前 的 很 多 课程 都 会 要 求 你 解决 一 些 问题 , 但 这 


问题 是 什 


的 选择 . 你 的 老师 可 能 会 依据 教 
当 作 对 课堂 内 容 的 补充 , 那 就 要 意识 到 你 可 能 


会 跳跃 着 阅读 . 为 了 帮助 你 , 我 会 使 各 章 尽 可 能 地 保持 独立 性 . 这 意味 着 , 如 果 你 把 


本 书 从 头 读 到 尾 , 就 会 发 现 有 些 段落 很 像 之 前 的 内 容 . 这 利 
是 为 了 让 本 书 更 加 便 卫 
以 直接 跳 到 那 一 章 . 
下 一 章 是 所 有 课程 的 基础 
讨论 . 虽然 大 部 分 课程 都 会 使 用 微 积分 , 但 并 非 全 部 如 此 . 这 3 
微 积 分 在 哪里 最 有 用 ? 当 扩 大 讨 


| 论 范围 


微 积 分 , 我 们 也 能 进行 下 去 . 


1 我们 将 引 


入 概率 论 


PP 的 基本 


的 难题 ,， 那 训 


情况 并 非 偶然 , 这 样 做 
六 使用. 如 果 你 在 课 特 上 遇 到 了 有 关 伽 马 分 布 


可 


念 , 并 对 其 定义 展 


J 


不 是 个 问题 ; 不 使 用 


时 , 微 积分 就 


非常 有 必要 了 . 微 积分 可 以 应 用 于 更 多 的 例子 , 还 可 以 用 来 求 概率 (事实 上 , 微 积 4 


基本 定理 允许 我 们 将 概率 理解 为 曲线 下 方 区 域 的 面 


不 过 , 在 下 一 章 有 
要 的 问题 , 但 它 没有 完全 TE 
很 多 内 容 都 比较 通俗 易 懂 我 赞同 这 一 点 我 
格 的 内 容 强加 给 他 们 , 强迫 他 们 消 
微 的 技术 问题 是 错误 的 . 


忽视 这 种 


有 的 答案 . 通 


常情 


职 , 可 以 通 


Sa 


的 讨论 , 从 而 


使 它们 在 你 的 头脑 


习 到 更 高 等 、 


么 容易 和 人 危 


儿 分 钟 时 间 来 浏览 一 


因此 , 请 注意 : 第 
而 为 这 门 课 打 下 坚实 的 基础 , 但 
如 果 你 的 课程 根本 没有 涵盖 o 代数, 那么 可 以 放心 地 易 


化 并 使 用 j 


FP 留 下 印象 , 然后 暂时 不 去 考虑 它们 , 直至 


过 求 积 分 来 计算 ). 
重要 的 问题 . 我 们 要 多 严格 地 定义 一 切 ? 这 是 个 非常 重 
况 下 , 第 一 次 课 不 会 进行 真正 的 分 析 ， 
认为 对 于 大 多 数学 4 
不 是 最 好 的 主意 . 也 就 是 说 , 我 认为 
个 好 的 折 中 办 法 是 先 对 这 些 问 题 进行 简单 


严格 的 课程 . 你 应 该 意识 到 在 摇摇欲坠 的 基 而 


上 构建 一 个 型 


站. 喝 杯 可 


险 (我 们 将 在 2.6 节 的 集合 论 中 看 到 这 利 
2 章 的 部 分 内 容 是 非常 密集 的 . 我 们 将 引入 正确 的 术语 


P 灾 入 


将 来 学 


LE 论 有 多 


任 是 如 何 发 生 的 ). 


的 饮料 或 者 吃 点 可 


6 过 那 部 分 内 容 , 但 
的 食物 , 让 自己 处 于 一 种 平 


从 


除 此 之 外 我 们 不 会 在 本 书 中 介绍 更 多 其 他 的 内 容 . 
也 不 妨 花 


静 的 状态 , 然后 去 浏览 这 部 分 内 容 . 毕竟 , 知道 命题 为 什么 成 立 就 是 你 学 习 数 学 的 


在 结束 引言 之 前 , 我 们 给 出 一 点 建议 . 在 阅读 这 本 书 的 过 程 中, 你 会 发 现 我 反 
复 地 强调 这 个 技巧 的 威力 或 那个 技巧 的 用 处 . 数学 的 意义 并 不 是 孤立 地 解决 问题 . 


你 也 希望 能 够 解决 类 似 的 问题 , 甚至 更 好 地 解决 新 问题 . 我 希望 你 能 熟练 地 识别 每 


种 方法 在 什么 情况 下 可 以 充分 发 挥 作 上 月 


中 一 个 是 : 每 个 人 都 有 自 


日 


昌 . 有 人 句 名 言 对 我 很 有 帮助 . 锤子 原理 (或 定 
马 斯 洛 (1966) 曾 说 过 :“ 如 果 你 手 里 只 有 一 把 锤子 ， 


A 


pa | 


己 擅长 的 领域 


律 ) 有 很 多 种 变 体 . 亚伯拉罕 
那么 你 可 能 会 不 自沉 地 把 所 有 东西 都 当 作 钉子 来 看 待 . ” 另 一 种 很 好 的 说 法 
伯 纳 德 ” 巴 鲁 克 提出 的 :“ 如 果 你 所 拥有 的 只 有 一 把 锤子 , 那么 一 切 看 起 来 都 像 杀 
ee 
我 们 可 以 从 很 多 角度 来 看 这 人 句 话 , 其 
当 遇 到 问题 时 , 我 们 首先 想到 的 是 能 


否 把 它 融 入 一 个 我 们 非常 熟悉 和 精通 的 框架 


中 . 但 我 们 还 可 以 从 另 一 个 角度 来 看 这 个 问题 . 如 果 你 和 其 他 人 一 样 , 在 相同 的 时 
间 内 采用 同一 种 技巧 来 解决 同 


一 个 问题 , 那 就 很 难 突显 


自己 的 优势 , 散发 不 出 自 


身 


的 光芒 . 放下 锤子 , 拿 起 螺丝 刀 , 你 将 有 一 个 完全 不 同 的 视角 , 那些 对 他 们 来 说 似乎 


x 
为 能 

挑战 时 
花 任 何 时 


经 有 了 , 那么 现 


口 


《 


快速 解决 
, 他 很 清 
间 在 标准 方法 上 , 他 相 


任 以 解决 的 问题 对 你 来 说 却 很 容易 . 理 查 德 


臣 自 忆 


在 唯 


别 亲 了 , 费 曼 先生 》. 
那 本 书 还 展示 了 如 何 对 积分 符号 


费 曼 是 这 个 方法 的 伟大 倡导 者 . 他 


他 人 无 法 求解 的 积分 问题 而 享有 盛名 ! 当 接 受 一 项 令 人 烦恼 的 


己 的 朋友 并 不 傻 , 已 经 尝试 了 所 有 的 标准 
言 如 果 能 用 他 们 的 方法 解决 这 个 问 
的 办 法 就 是 尝试 一 些 不 同 的 思路 . 下 面 这 段 话 引 


AA 
题 , 答 


下 的 参数 求 微分 , 这 是 一 种 特定 运 


算 . 其 实 , 大 学 课程 通常 不 会 强调 这 一 点 , 但 我 知道 该 如 何 使 用 这 种 方法 
而 且 经 常 使 用 它 . 因此 , 由 于 自学 了 那 本 书 , 我 在 求 积分 方面 有 自己 的 独 


特 方法 . 


结果 是 , 一旦 麻 省 理工 学 院 或 普林斯顿 大 学 的 学 生 做 积分 时 遇 到 了 困 
难 , 通常 是 因为 他 们 学 过 的 标准 方法 不 管用 . 但 对 于 围 道 积分 和 级 数 展开 


的 题目 , 他 们 都 知道 该 怎么 做 . 此 时 , 我 会 试 着 在 积分 符号 下 


Ab 


求 微分 , 这 通 


党 能 解决 问题 . 因此 , 我 因 求 积分 出 了 名 , 而 这 只 是 因为 我 的 工具 箱 与 其 
他 人 的 不 同 ; 在 把 问题 交 给 我 之 前 , 他 们 已 经 尝试 了 自己 所 有 的 工具 


习题 1.5.1 
是 相互 独立 


月 的 概率 是 多 少 ? 对 于 


假设 每 个 人 都 等 可 能 地 出 生 在 一 年 中 的 任何 
的 , 那么 他 们 出 生 在 同一 个 
任意 的 有 € {0,1…… ,12}, 求人 


概率 . 你 对 
习题 1.5.2 
他 人 生日 相 


保留 生 


个 人 的 出 生 月 份 最 多 相差 一 个 月 的 可 能 怕 
日 问题 中 的 条 件 不 变 , 并 假设 每 次 只 有 


1.5 “ 习 


题 


同 的 人 最 有 可 能 多 


儿 个 进入 房间 ? 


的 概率 是 多 少 ? 他 介 
也 们 的 出 和 


房间 . 首次 与 房间 里 


天 


方法 . 因此 , 费 曙 没有 
案 早 就 已 
日 于 他 的 ] 


由 


其 


个 月 里 . 如 果 两 个 人 的 出 生 月 份 
] 的 出 生 月 份 最 多 相差 一 个 
EE 月份 最 多 相差 个 月 的 
E 感 到 惊讶 吗 ? 
个 人 进入 


™ 


CD 
OO 
这 
地 
IN 


习题 1.5.3 ”我 们 已 经 证 明了 , 当 房 间 里 有 23 人 时 , 至 少 有 两 人 生日 在 同一 天 的 概率 为 50%. 


平均 来 说 , 需要 多 少 人 才能 使 至 少 有 两 人 生日 


1.5.4 ”证 明 log(1 


在 同一 天 ? 


一 2) 的 泰勒 级 数 展开 式 为 -~(w 二/2 十 wa/3 十 …). 


1.5.5 (近似 ) 对 于 we [一 1/10, 1/10], logw 与 其 一 阶 泰勒 级 数 近似 ( 即 -0) 之 间 的 平 


均 误 差 是 多 少 ? 也 就 是 计算 
1/10 
/ hogG —) = (wl du/(2/10). 


一 1/10 


习题 1.5.6 ”证 明 : log, (xy) = logs XY 十 logs y( 记 住 , 如 果 logsz = z, 那么 z = 5). 
E 日 问题 中 , 找到 能 导出 表达 式 V 

求 出 给 定 D 时 的 误差 范围 . 
习题 1.5.8 ”你 认为 需要 多 少 人 才能 使 至 少 三 个 人 的 生日 在 同一 天 的 概率 为 50%? 需要 多 少 
的 概率 为 50%? 作者 在 曼 荷 莲 学 院 讲授 概率 论 时 , 在 他 
的 生日 都 不 在 同一 天 , 但 共有 三 对 人 的 生日 在 同一 天 . 


习题 1.5.7 “在 4 


人 才能 使 至 少 有 两 对 人 生日 相同 
与 全 班 31 个 学 生 中 间 , 任意 三 个 人 


| 


习题 1.5.9 ”回顾 一 下 9 


个 人 的 生日 在 同一 天 的 概率 为 75%. 


习题 1.5.10 ”重新 考虑 拉 里 ” 伯 德 和 魔术 师 约 输 进 的 投篮 比赛 , 他 们 交 蔡 投篮 并 且 由 拉 里 


E 日 问题 并 改变 其 中 的 参数 , 求 出 一 年 共有 多 少 天 才能 使 23 人 中 有 两 


万 .31log2 和 1/2 十 V 万 .721og7 的 误差 项 ， 


伯 德 完投, 先 命中 的 人 获胜 . 假设 拉 里 ” 伯 德 的 命中 率 始终 为 psp, 魔术 师 约 输 逊 的 命中 


率 始终 为 pw, 其 中 


pB 和 pw 是 相互 独立 的 随机 变量 , 而 且 都 服从 均匀 分 布 . (这 意味 着 ， 


对 于 pp 和 pxz 来 说 , 在 [gj C [0,1] 中 取 值 的 概率 都 是 5 一 a; 并 DB 得 不 到 任何 


有 关 pw 的 信息 . ) 


(1) 拉 里 ” 伯 德 获 有 


LE 的 概率 是 多 少 ? 


(2) 在 比赛 中 , 拉 里 


这 道 题 最 困难 的 地 方 在 于 弄 清楚 问 的 是 什么 ? 


习题 1.5.11 “人 类 有 23 对 染色 体 ; 在 每 一 对 染色 体 中 , 有 一 条 来 自 于 父亲 , 为 一 条 则 来 自 于 


母亲 . 假设 每 个 父亲 /母亲 都 随机 地 将 一 条 染色 体 遗 传 给 孩子 . 我 们 始终 假设 父母 没有 相 
同 的 染色 体 (这 并 不 是 有 效 的 假设 , 但 可 以 简化 分 析 ). 在 两 个 兄弟 姐妹 之 间 , 你 认为 共有 
多 少 条 相同 的 染色 体 ? 假设 现在 有 两 对 夫妻 ; 两 位 丈夫 没有 任何 关系 , 而 且 他 们 与 两 位 妻 
子 也 都 没有 任何 血缘 关系 , 但 两 位 妻子 是 同 卵 
两 个 孩子 . 那么 父母 不 相同 的 孩子 之 间 共 有 多 少 条 相同 的 染色 体 ? 一 个 孩子 与 表 兄 弟 姐 


伯 德 比 魔术 师 约 输 逊 更 有 可 能 获胜 的 概率 是 多 少 ? 


双胞胎 , 拥有 相同 的 染色 体 . 每 对 夫妻 都 有 


妹 的 相同 基因 数 要 比 与 杀 兄弟 姐妹 的 相同 基因 数 更 多 的 概率 是 多 少 ? 编写 一 个 简单 的 程 


序 来 计算 这 个 概率 


习题 1.5.12 ”重新 考虑 前 一 个 习题 , 但 现在 假设 麦子 是 三 胞 胎 , 且 每 人 有 一 个 孩子 . 那么 这 


三 个 孩子 共有 多 少 条 相同 的 染色 体 ? 编写 一 个 计算 机 程序 来 探讨 这 个 习题 . 
习题 1.5.13 ”认真 研读 “生日 攻击 ”, 看 看 生日 问题 在 密码 学 方面 的 有 趣 应 用 . 
目 “ 生 日 攻击 ”及 其 页 面 上 的 链接 是 个 不 错 的 开始 . 
习题 1.5.14 ”这 个 习题 能 很 好 地 阐述 “从 简单 的 情形 开始 ”. 有 100 个 人 正 等 待 登 机 . 第 一 


个 人 的 机 票 对 应 着 


1 号 座位 ,队列 中 第 二 个 人 的 机 票 对 应 着 2 号 座位 , 依 此 类 推 , 一 直 


AS 


佳 基 百科 条 


到 第 100 个 人 一 一 他 的 机 票 对 应 着 100 号 月 


E 位 .第 一 个 人 没有 留意 到 他 的 机 票 对 应 的 


是 1 号 座位 , 而 是 随机 地 从 100 个 座位 中 任意 挑选 了 一 个 (注意 : 他 可 能 会 随机 选择 坐 
在 1 号 座位 上 ). 从 此 刻 起 , 后 面 的 99 个 人 都 始终 尽 可 能 坐 在 他 们 的 指定 座位 上 ; 如 果 
座位 被 占 了 , 他 们 就 会 从 剩 下 的 座位 中 随机 选择 一 个 (第 二 个 人 在 第 一 个 人 之 后 坐 下 来 ， 
第 三 个 人 在 第 二 个 人 之 后 坐 下 来 , 等 等 ). 那么 , 第 100 个 人 坐 在 100 号 座位 上 的 概率 是 
多 少 ? 
习题 1.5.15 ”想象 一 下 , 迈克 尔 ”乔丹 加 入 了 拉 里 ” 伯 德 和 魔术 师 约翰 进 的 比赛 , 于 是 现在 
有 三 名 球员 参加 篮球 比赛 , 他 们 的 投篮 命中 率 分 别 是 pi, pz 和 ps. 那么 每 名 球员 的 获胜 
概率 是 多 少 ? 如 果 有 n 名 球员 参加 比赛 , 并 且 命中 率 分 别 是 pi, pz2,… ,pn, 那么 每 名 球 
员 的 获胜 概率 是 多 少 ? 
习题 1.5.16 ”修改 篮球 比赛 , 使 得 一 共有 2013 名 球员 参加 比赛 , 他 们 的 编号 依次 为 1,2,…… ， 
2013. 第 i 名 球员 的 命中 率 始终 为 1/2i. 那么 第 一 名 球员 获胜 的 概率 是 多 少 ? 
习题 1.5.17 ”假设 魔术 师 约 翰 逊 和 拉 里 ” 伯 德 正在 进行 一 场 投篮 比赛 , 但 比赛 规则 发 生 了 改 
变 . 如 果 某 位 球员 获胜 , 那么 他 必须 投篮 命中 , 而 另 一 名 球员 必须 在 相应 投篮 中 失败 . 例 
如 , 如 果 拉 里 ” 伯 德 先 投 , 并 且 在 第 一 次 投篮 时 失败 , 而 魔术 师 约 翰 逊 在 第 一 次 投篮 时 成 
功 , 那么 魔术 师 约翰 逊 获胜 . 但 是 , 如 果 两 个 人 都 在 第 一 次 投篮 时 命中 , 那么 他 们 就 要 继 
续 比 赛 . 用 p 表示 拉 里 ” 伯 德 的 命中 率 , g 表示 魔术 师 约翰 逊 的 命中 率 , 并 假设 p 和 9g 都 
是 常数 . 那么 拉 里 ” 伯 德 获胜 的 概率 是 多 少 ? 这 与 谁 先 投 锯 有 关系 吗 ? 为 什么 ? (在 进行 
数学 运算 之 前 , 试 着 回答 最 后 一 个 问题 . ) 
1.5.18 ” 例 1.2.1 的 答案 是 否 与 c 趋向 于 负 无 穷 大 时 的 极限 值 保 持 一 致 ? 
1.5.19 ”想象 从 一 个 细菌 开始 . 在 每 个 整数 时 刻 t, 所 有 独立 存在 的 细菌 要 么 以 概率 p 
分 裂 成 两 个 细菌 , 要 么 以 概率 1 一 p 死亡 . 作为 p 的 函数 , 在 某 个 时 刻 所 有 细菌 都 死亡 的 
概率 是 多 少 (或 者 说 , 细菌 永久 存活 的 概率 是 多 少 )? 
习题 1.5.20 ”把 上 一 个 习题 进行 推广 , 并 试 着 解决 . 例如, 也 许 细菌 能 以 不 同 的 概率 分 裂 成 
不 同 数量 的 细菌 , 或 者 存在 某 种 依赖 关系 .………… 
习题 1.5.21 ” 谢 尔 宾 斯 基 三 角形 是 从 一 个 等 边 三 角形 开始 的 , 通过 连接 原 三 角形 的 三 边 中 点 
得 到 一 个 新 三 角形 , 然后 再 把 这 个 新 三 角形 去 掉 . 接 下 来 , 对 余下 的 三 个 小 三 角形 重复 进 
行 上 述 步骤 次 . 假设 飞镖 落 在 某 给 定 区 域 的 概率 等 于 该 区 域 面积 与 原始 三 角形 面积 的 
比值 , 那么 从 原始 三 角形 内 掷 出 的 飞镖 落 在 谢 尔 宾 斯 基 三 角形 内 的 可 能 性 有 多 大 ? 
习题 1.5.22 ”Alice、Bob 和 Charlie 正在 依次 撕 骨 子 . 他 们 不 停 地 掷 , 直到 有 人 掷 出 6 为 上 . 
那么 每 个 人 赢 的 概率 是 多 少 ? 
习题 1.5.23 ”Alice、Bob 和 Charlie 正在 依次 撕 般 子 . 那么 第 一 个 掷 出 6 的 人 是 Alice, 第 
二 个 掷 出 6 的 人 是 Bob, 且 第 三 个 据 出 6 的 是 Charlie 的 概率 是 多 少 ? 
习题 1.5.24 ”Alice、Bob 和 Charlie 正在 折 骨 子 . 那么 第 一 个 6 由 Alice 掷 出 , 第 二 个 6 
Bob 掷 出 , 且 第 三 个 6 由 Charlie 掷 出 的 概率 是 多 少 ? 
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在 接 下 来 的 三 道 习题 中 , 想象 你 正 处 在 一 个 奇怪 的 地 方 . 在 这 里 , 从 一 个 (非常 大 的 ) 数量 
中 随机 抽取 一 只 兔子 , 这 只 兔子 出 生 在 给 定年 份 的 概率 与 这 一 年 有 关 . 因此 , 兔子 出 生 在 今 
的 概率 是 1/2, 出 生 在 去 年 的 概率 是 1/4; 更 一 般 地 说 , 它 出 生 在 n 年 前 的 概率 为 1/2". 
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习题 1.5.25 ”如 果 我 们 有 20 只 人 兔子 , 那么 相同 的 出 生年 份 一 共有 多 少 个 ? 
习题 1.5.26 ”我 们 一 共和 需要 多 少 只 兔子 才能 使 有 两 只 兔子 出 生 在 同一 年 的 概率 至 少 为 50%? 
习题 1.5.27 ”前 两 具 出 生 在 同一 年 的 兔子 是 在 今年 出 生 的 概率 为 多 少 ? 
习题 1.5.28 ”编写 一 段 代码 , 模拟 给 定年 份 长 度 的 生日 问题 . 在 一 年 有 365 天 的 前 提 下 , 至 
少 进 行 10 000 次 试验 , 求 找 出 一 对 生日 的 平均 等 等 时 间 . 
习题 1.5.29 ”编写 一 段 代 码 , 模拟 给 定 概率 p 和 g 的 篮球 问题 . 令 q = 0.5, 画 出 p 取 不 同 什 
时 , 拉 里 ” 伯 德 在 1000 次 比赛 中 的 获胜 百分比 . 
习题 1.5.30 ” 证明: 对 于 任意 的 > e [0,1], 至 少 存在 一 组 概率 p,qg e [0,1], 使 得 p 关 0 且 
(一 DT 一 g) 二 7 
习题 1.5.31 ，” 毫 无 疑问 , 在 我 们 的 篮球 比赛 中 , 先 投篮 的 人 具有 巨大 的 优势 . 为 了 减弱 这 
优势 , 现在 要 求 第 一 个 人 要 在 第 二 个 人 命中 n 次 之 前 先 命中 m 次 . 如 果 p = g = 0 
那么 你 认为 m 和 nn 等 于 多 少 才 是 公平 的 ? 找 出 一 对 (m,n), 满足 两 者 之 和 最 小 , 并 且 能 
使 第 一 个 人 获胜 的 概率 在 49% 和 51% 之 间 . 
习题 1.5.32 ”尝试 运行 下 面 的 Mathematica 代码 , 创建 一 个 n = 10 的 斐 波 那 契 数列 (或 将 
其 转换 为 你 熟悉 语言 中 的 等 效 代码 ). 尝试 运行 n = 100 的 代码 (你 不 需要 把 它 运 行 到 最 
后 ). 请 解释 一 下 , 为 什么 这 段 代 码 不 适合 运行 取 值 较 大 的 n. 
n= 10; 
Fibset = {}; 
F[1] := 1 
F[2] := 1 
F[i_] := F[i - 1] + F[i ~- 2] 
For[i = 1, i <= n, i++, 
Fibset = AppendTo[Fibset, F[i]]]; 
Print [Fibset] ; 
下 面 的 代码 效果 更 好 . 
F[1] = 1; F[2] = 
Flist = {}; 
num = 100; 
curr = F[2]; 
prev = FI[1]; 
For[n = 3, n <= num, n++, 
{ 
curr = curr + prev; 
prev = curr - prev; 
Flist = AppendTo[Flist, curr]; 
中” 
Print [Flist] 
习题 1.5.33 ”编写 能 够 更 有 效 地 生成 前 ”个 辈 波 那 契 数 的 代码 , 但 仍 要 使 用 递 推 关系 . 
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习题 1.5.34 证明: 斐 波 那 契 数列 呈 指 数 增长 . (提示 : 找到 增长 的 上 限 和 下 限 . ) 
习题 1.5.35 ”下面 的 Mathematica 命令 用 来 绘制 超级 碗 问题 中 的 各 种 函数 . 
f[p_, x_, B_] := 500000 p+(1-p)Bx-500-B 
g[p_, x_, B_] := Min[500000, B x] - 500 - B 
Plot[f[.8, 3, B], {B, 0, 1200000}] 
Plot[g[.8, 3, B], {B, 0, 500000}] 
Manipulate[Plot[g[p, x, B], {B, 0, 500000}], 
{p, 0, 1}, {x, 1, 10}] 
Manipulate 是 个 非常 棒 的 命令 , 因为 它 允 许 你 调整 几 个 参数 , 并 查看 图 形 的 变化 . 当 x 和 
p 改变 时 , 看 看 我 们 的 最 低 收益 (由 9 给 出 ) 会 有 什么 变化 . 通过 观察 , 我 们 得 到 了 它 与 
Zz 之 间 的 关系 , 对 此 你 感到 惊讶 吗 ? 明确 地 说 , 我 们 考察 的 是 当 x 变动 时 , 最 低 收益 的 最 
大 值 以 及 (从 财务 上 看 ) 无 须 关 心 比赛 结果 的 下 注 时 机 是 如 何 发 生 改变 的 . 解释 你 看 到 的 
东西 . 
习题 1.5.36 ” 想 想 你 在 生活 中 面临 风险 的 一 些 例子 , 以 及 你 可 以 做 些 什 么 来 最 大 限度 地 减少 
损失 . 
习题 1.5.37 ”赌博 部 分 有 一 个 较 大 的 主题 , 那 就 是 提出 正确 问题 的 重要 性 . 在 讨论 生日 问题 
时 我 们 也 看 到 了 这 一 点 . 可 悲 的 是 , 生活 中 的 问题 往往 陈述 得 并 不 清楚 , 这 可 能 是 粗心 大 
意 造成 的 , 也 可 能 是 人 们 通常 不 清楚 应 该 研究 什么 而 导致 的 ! 最 近 , 我 正在 给 孩子 们 读 一 
本 天 文学 的 书 , 其 中 有 一 段 说 , 如 果 太 阳 被 掏 空 , 那么 就 可 以 把 130 万 个 地 球 装 在 里 面 . 
对 于 这 可 能 意味 着 什么 , 请 给 出 两 种 不 同 的 解释 ! (提示 : 你 可 以 假设 地 球 和 太阳 都 是 完 
美的 球体 .) 
1.5.38 ”我 们 来 进一步 探讨 人 们 的 风险 偏好 是 如 何 影响 决策 的 .根据 参与 一 次 还 是 多 
次 , 我 们 的 策略 会 有 很 大 的 不 同 . 假设 有 两 种 游戏 : 玩 第 一 种 游戏 时 , 你 总 能 赚 到 40 美 
元 ; 玩 第 二 种 游戏 时 , 你 有 一 半 的 机 会 获得 100 美元 , 有 一 半 的 机 会 获得 0 美元 . 如 果 只 
能 玩 一 次 , 你 愿意 玩 哪 种 游戏 ? 如 果 能 玩 10 次 呢 ? 如 果 能 玩 100 次 , 甚至 1000 次 呢 ? 编 
写 一 个 计算 机 程序 , 对 重复 玩 第 二 种 游戏 要 优 于 重复 玩 第 一 种 游戏 的 概率 展开 数 人 
习题 1.5.39 ”给 定 实数 a、b 和 c, 考察 方程 ax? 十 bx 十 c = 二 0 的 解 . 如 果 固 定 其 中 两 个 量 ， 
当 改 变 第 三 个 量 时 , 方程 的 两 个 根 会 发 生 什么 样 的 变化 ? 我 们 需要 考虑 一 个 
方程 是 否 有 实 根 (如 果 有 的 话 , 共有 多 少 个 ) 以 及 根 之 间 的 距离 有 多 远 (不 管 是 在 实数 轴 
上 还 是 在 复 平面 上 . 回忆 一 下 , 复数 的 形式 是 > = zx 十 iy, 其 中 i= V 一 站. 
习题 1.5.40 ”我 们 回顾 一 下 上 一 题 . 代数 基本 定理 断言 , 任意 一 个 n 次 复 系数 多 项 式 都 恰 有 
n 个 根 ( 根 的 个 数 必须 按 重 数 计算 ; 因此 , z 十 xz? = 0 的 根 为 0、0、; 和 一 让 ， 二 次 
多 项 式 的 根 与 原点 之 间 的 距离 能 否 用 该 多 项 式 系数 的 函数 来 限定 ?也 就 是 说 , 如 果 ” 是 
ax? 十 bz 十 c= 二 0 的 根 , 那么 能 否 找 到 关于 a,b,c 的 函数 , 使 得 |7| 的 取 值 范围 可 以 用 该 
函数 来 表示 ? 
习题 1.5.41 ”把 前 两 个 练习 推广 到 任意 一 个 固定 有 限 次 的 多 项 式 上 . 
习题 1.5.42 ”在 上 一 个 习题 中 , 你 要 把 结论 推广 到 固定 有 限 次 的 多 项 式 上 . 如 果 考 虑 的 是 无 
限 次 多 项 式 , 你 认为 答案 会 不 同 吗 ? 例如 , 假设 级 数 > anz” 对 所 有 的 x 都 收敛 . 那 
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么 根 是 什么 样 的 ? 你 觉得 对 代数 基本 定理 的 推广 还 成 立 吗 ? 换 句 话说 , 它 必 须 有 根 吗 (如 
果 有 的 话 , 你 认为 会 有 无 穷 多 个 根 吗 )? 
习题 1.5.43 (积分 符号 下 求 微分 ) 下 面 描述 费 曼 提 到 的 方法 (有 关 微 分 恒等式 的 其 他 示例 ， 

请 参阅 第 11 章 ). 它 的 思路 是 将 参数 a 引入 关于 z 的 积分 中 , 并 把 整个 表达 式 记 作 f(a). 

注意 , f(a) 是 通过 先 求 被 积 函 数 关于 a 的 导数 , 然后 再 对 xz 求 积分 而 得 到 的 ; 我 们 期 待 

能 由 z 的 积分 得 出 六 (a) 的 具体 表达 式 , 这 样 就 可 以 求 出 了 (a) 的 不 定 积分 , 然后 令 a 

取 恰 当 的 值 就 可 以 得 到 最 初 的 积分 . 这 里 使 用 的 例子 非常 好 . 考虑 
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于 ja) = 1/(a 十 1), 因此 一 定 有 


f(a) = log(a+1)+o, 


其 中 ec 是 常数 . 由 f(0) = 0 可 知 c= 0, 从 而 有 f(a) = log(a 十 1). 这 样 就 得 出 了 一 个 
非常 漂亮 的 结果 , 我 们 要 算 的 积分 就 是 f(5) = log 6. 

利用 这 种 方法 来 试 试 下 面 的 例子 . 祝 你 好 运 : 弄 清 楚 如 何以 一 种 有 用 的 方式 引入 参 

数 有 时 是 非常 重要 的 . 在 下 面 的 例子 中 , 我 们 已 经 引入 了 一 个 参数 . 注意 , 第 三 个 等 式 中 
的 cos(a) 是 对 1/2 的 替换 . 
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一 位 严谨 的 作家 在 写 每 一 句 话 的 时 候 ， 
么 ? (2) 用 什么 词 来 表达 ? (3) 什么 样 的 形象 或 习 
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让 意思 更 清晰 ? (4) 这 个 形象 
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的 概念 基础 , 而 不 是 
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容 是 关于 集合 与 元 素 的 技术 性 问题 . 这 利 
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世界 上 
其 是 概率 论 一 一 中 有 很 
因此 , 数学 家 不 得 不 重新 审视 其 基本 前 提 . 
为 这 有 助 于 我 们 更 好 
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也 理解 眼下 的 事 
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命题 有 多 么 容易 , 我 


们 将 从 罗素 悖 论 开始 . 这 是 数学 中 最 著名 的 悖 论 之 一 . 它 阐释 了 那些 “显然 ”正确 
的 陈述 其 实 是 错误 的 , 强调 了 仔细 证 明 的 必要 性 , 并 证 明了 你 在 下 面 的 定义 上 花费 
时 间 是 合理 的 . 

在 罗素 悖 论 之 后 , 我 们 将 讨论 集合 论 和 拓扑 学 中 的 一 些 必要 结果 , 然后 进入 本 
章 的 核心 概率 的 基础 . 为 了 全 面 学 习 好 这 门 课 并 严格 地 构建 理论 , 我 们 还 需 
要 实 分 析 中 的 一 些 结论 . 为 了 保持 完整 性 , 我 们 将 在 2.6 节 简 要 地 提 及 这 些 内 容 , 但 


精心 构建 这 样 一 个 体 


是 


系 并 不 是 我 们 的 


目的 , 也 不 


的 习 


必 论 


去 台 E 
月 用 


理 及 其 
怪 的 事 


虽然 已 经 过 去 了 几 十 年 , 但 我 仍然 记得 高 
坦 的 狭义 相对 论 做 了 一 般 怕 


相反 , 我 们 要 强调 主要 思想 . 在 大 多 数 情况 下 , 你 的 日 
EE 要 指南 . 如 果 你 只 
够 并 且 一 定 会 发 生 一 一 那么 这 其 实 就 是 一 个 完美 的 指南 . 
上 的 一 
二 三 年 级 的 学 9 


i 


前 
得 一 个 警告 一 一 处 理 无 穷 


el 
UU 


中 物理 课本 .| 
E 的 概述 ， 由 于 我 们 是 高 


绝 大 多 数 教师 第 一 堂 课 的 目 


标 . 


觉 和 常识 是 理解 概率 公 


大 时 要 小 心 , 因为 奇 


段 话 . 它 对 爱 因 斯 


对 这 门 学 


科 所 需 的 高 等 数学 入 
如 果 你 乘坐 的 是 一 和 


1 未 


50% 的 光速 奔跑 , 那 


1 识 毫 无 准备 , 因此 我 们 的 教材 只 
速度 
么 地 面 


述 了 结论 . 最 奇怪 的 一 点 是 ， 
FE 常 快 的 火车 , 它 的 速度 为 光速 的 75%, 而 你 寿 
上 的 观察 者 看 不 到 你 在 以 125% 的 光速 移动 ; 也 就 是 说 ， 
速度 是 不 可 加 的 ! 那么 他 看 到 的 速度 是 多 少 ? 根据 该 理论 , 没有 东西 比 光 传播 得 更 


E 火 车 内 以 


但 
可 
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快 . 用 e 表示 光速 , 如 果 火 车 的 速度 是 v#, 你 在 火车 内 奔跑 的 速度 为 vy, 那么 地 
面 上 的 观察 者 将 看 到 你 在 以 速度 (v# + wm)/LTT 至 他 ) 移动 . 在 这 个 例子 中 , 地 面 
观察 者 看 到 的 速度 大 约 是 光速 的 91%, 而 不 是 125%. 那么 更 加 现实 的 情况 是 什么 
样 的 ? 假设 在 一 辆 速度 为 700 英里 /小 时 “的 火车 上 , 有 名 优秀 的 奥运 短跑 运动 员 
正 以 50 英里 /小 时 的 速度 奔跑 , 那么 运动 员 的 速度 不 是 750 英里 /小 时 , 而 是 约 为 
749.999 999 999 941 678 652 2 英里 /小 时 1! 


这 本 书 接着 说 道 : 虽然 这 些 结果 看 起 来 有 悖 常理 ， 但 你 必须 记 住 ， 大 多 数 人 
的 速度 都 不 可 能 达到 光速 的 3/4， 我 始终 觉得 这 篇 文章 很 有 趣 , 但 随 着 时 间 的 推 


移 , 我 发 现 这 的 确 是 个 很 好 的 建议 . 要 特别 注意 , 不 要 太 依 赖 经 验 . 小 的 速度 的 确 


像 是 可 加 的 , 但 是 这 并 不 意味 着 在 速度 极 高 的 情况 下 这 种 模式 依然 成 立 , 或 者 说 


可 加 性 仍然 存在 . 我 们 不 能 把 责任 归 短 于 


F 几 个 1 


世纪 的 物理 学 家 都 没有 发 现 750 和 


749.999 999 999 941 678 652 2 之 间 的 差异 . 对 他 们 来 说 , 这 样 的 测量 误差 已 经 很 小 


了 


因此 他 们 认为 速度 能 够 简单 地 相 加 是 可 以 理解 的 . 
在 概率 论 中 , 我 们 也 会 遇 到 类 似 的 问题 . 然而 , 如 果 处 理 的 对 象 只 是 数量 有 限 


的 有 限 集 , 那么 一 切 都 很 好 , 我 们 的 直觉 就 是 一 个 极 好 的 向 导 ; 但 是 , 一 旦 涉及 无 穷 
大 , 我 们 就 必须 小 心 了 . 对 此 , 我 们 不 应 该 感到 特别 惊讶 , 因为 我 们 没有 任何 关于 无 


穷 大 的 真实 体验 .把 基于 现实 经 验 的 


险 的 . 


直觉 应 用 到 另 一 个 完全 不 同 的 领域 里 是 很 危 


最 后 , 我 们 用 伟大 的 马克 . 吐 温 的 至 理 


名 言 来 结尾 , 他 的 这 段 话 很 好 地 总 结 了 


我 们 的 讨论 : “要 注意 , 只 从 经 验 中 汲取 智 
蜂 然 它 以 后 不 会 坐 在 热 炉 置 上 是 件 好 


2.1 


慧 , 否则 我 们 就 会 像 上 只 坐 在 热 炉 站 上 的 猪 . 
事 , 但 它 也 绝 不 可 能 坐 在 冷 炉 时 上 了 .” 


悖 


论 


本 节 利 用 集合 论 的 知识 来 解释 罗素 悖 论 , 并 讨论 它 在 概率 论 中 的 意义 . 如 果 愿 
意 , 你 可 以 放心 地 跳 过 本 ,因为 在 接 下 来 的 内 容 中 , 我 们 不 会 直接 用 到 它 的 结果 . 


不 过 , 如 果 你 能 至 少 略 读 一 下 , 就 会 明和 


没完 没 了 地 证 明 那 些 看 似 “ 显 然 成 立 


”的 命题 


为 什么 数学 家 们 会 如 此 执着 于 严谨 , 并 且 


在 阅读 时 , 想 一 下 你 用 了 多 少 个 词 


来 描述 日 常事 物 或 数学 概念 . 尤其 要 多 思考 , 试 着 把 定义 从 最 基本 的 层面 上 说 出 来 . 
不 断 提 出 问题 , 看 看 你 能 摸索 多 远 . 例如 , 我 们 都 知道 连续 函数 是 什么 : 拿 笔 在 纸 


上 画 一 条 曲线 , 整个 过 程 从 不 跳跃 、 从 不 打 洞 , 笔 总 是 从 左 向 右 移动 . 如 果 你 在 说 这 


些 的 同时 还 提供 了 一 张 图 片 , 那么 你 的 朋友 就 能 很 好 地 理解 你 想 表达 的 意思 , 但 这 
个 定义 对 于 数学 家 来 说 绝对 是 个 点 上 梦 . 这 很 不 精确 , 而 且 不 能 系统 地 解决 问题 . 正 


确 的 方法 是 , 必须 先 定义 函数 是 什么 ， 


Q@ 1 英里 约 为 1.6 千 米 .一 一 编者 注 


只 有 在 这 一 点 明确 之 后 , 我 们 才能 继续 理解 


函数 的 连续 性 . 接 下 来 的 目标 是 要 强调 , 有 些 词 的 定义 似乎 是 “显而易见 ” 的 , 并 且 
所 有 人 都 很 清楚 它 是 什么 , 但 其 实 根本 不 是 这 样 . 事实 上 , 想 要 精确 地 定义 它们 通 
常 很 难 ! 
希望 你 在 之 前 的 课程 中 学 过 集合 ; 如 果 你 没 学 过 (或 者 虽然 学 过 , 但 已 经 隔 了 
很 长 一 段 时 间 ), 那么 我 们 会 在 这 里 快速 地 回顾 一 下 相关 内 容 . 如 果 有 一 个 集合 4， 
那么 ae A 表示 a 是 4 中 的 元 素 , 而 a 4 4 则 意味 着 4 中 不 包含 a. 例如, 2004 和 
2007 是 由 全 体 整 数 所 构成 的 集合 中 的 元 素 (我 们 用 2 表示 全 体 整 数 的 集合 , Z 来 
自 德语 Zahl, 意思 是 数 ), 而 2005.5 就 不 是 整数 . 类 似 地 , 3 友 十 + 一 9 是 由 全 体 三 次 
多 项 式 构 成 的 集合 中 的 一 个 元 素 , 但 是 cos(t) 不 是 这 个 集合 中 的 元 素 , 因为 它 不 是 
一 个 三 次 多 项 式 . 此 外 , 在 集合 的 定义 中 , 冒号 : 应 该 读 作 “使 得 ”( 有 些 作者 会 把 : 
赫 换 成 一 ). 因此 , {y :y=a+bv5abe2Zl 表示 使 得 y 能 被 写成 a 十 bV5 形式 的 
所 有 元 素 y 构成 的 集合 , 其 中 a 和 5 都 是 整数 ， 

开场 白 说 得 够 多 , 是 时 候 转 入 正题 了 . 罗素 悖 论 表 明 , 依靠 直觉 来 判断 该 如 何 
使 用 集合 会 带 给 我 们 麻烦 . 我 们 提出 这 个 悖 论 是 为 了 展示 构造 集合 的 微妙 之 处 . 特 
别 是 , 并 非 任 何 我 们 希望 其 成 为 集合 的 东西 都 真 的 是 集合 . 到 目前 为 止 , 你 应 该 已 
经 见 过 很 多 集合 了 . 数学 中 的 例子 包括 整数 集 、 实 数 集 或 者 素数 集 , 更 有 趣 的 例子 
有 : 所 有 赢得 超级 碗 比赛 的 人 , 所 有 登 上 过 月 球 的 人 , 或 者 所 有 既 赢 过 超级 碗 比赛 
又 登 上 过 月 球 的 人 . 截止 到 写作 本 书 的 时 候 , 最 后 那个 集合 仍 是 个 空 集 ( 空 集 是 最 
重要 的 集合 之 一 )! 

如 果 PP 是 某 种 性 质 , 那么 全 体 具 有 性 质 P 的 对 象 就 自然 构成 一 个 集合 . 例如 ， 
P(x) 可 以 表示 z 是 一 个 整数 , 还 可 以 表示 x 是 1701z2 十 1864zx 十 16 309 的 一 个 根 ， 
又 或 者 表示 z 是 一 个 次 数 不 超 过 4 的 整 系数 多 项 式 . 这 些 都 可 以 生成 很 好 的 集合 . 
第 一 个 集合 是 整数 集 , 即 ZZ = {.… ,一 2, 一 1,0,1,2,.…}， 由 二 次 方程 的 求 根 公式 可 
知 , 第 二 个 集合 是 {(-932 一 iV26 872 985)/1701, (一 932 十 iV26 872 985)/1701}. 最 
后 一 个 集合 写 起 来 有 点 困难 : 


{p(t) = aatt + a3t? + azt? + Qit+ ao : a0,Q1, 42, 43,44 € Z}. 


对 于 最 后 这 个 集合 , 我 们 不 能 把 多 项 式 的 变量 写成 x, 因为 z 已 经 被 用 来 表示 但 
合 中 的 任意 元 素 了 . 这 没什么 大 不 了 的 , 用 另 一 个 字母 来 表示 虚拟 变量 就 行 了 . 幸 
运 的 是 , 英文 字母 表 中 有 很 多 不 错 的 选择 ( 当 z 被 占用 时 , 大 多 数 数学 家 更 喜欢 使 
用 局 . 

现在 我 们 来 看 一 个 奇怪 的 P(z), 你 可 能 从 没 见 过 这 种 情形 . 令 P(z) 表示 x 荆 x. 
也 就 是 说 , 对 x 而 言 , 如 果 P(z) 是 真 的 , 那么 x 就 不 是 自身 的 元 素 ; 但 如 果 P(x) 
为 假 , 那么 x 就 是 z 中 的 元 素 . 绝 大 多 数 对 象 都 不 是 自身 的 元 素 . 例如 , Z 是 所 有 
整数 的 集合 : {.… ,一 2, 一 1,0,1,2,…}. 很 明显 , Z 94 Z, 因为 Z 的 元 素 是 整数 而 不 
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是 整数 的 集合 . 这 一 特性 是 罗素 悖 论 的 核心 . 如 果 任 何 满足 给 定性 质 的 东西 都 是 全 
合 , 那么 我 们 就 可 以 构造 出 集合 
R= {rz:r¢ 7}, 


其 中 P(x) 表示 x 4x. 
那么 RR 是 集合 吗 ? 如 果 是 , 它 的 元 素 是 什么 ? 如 果 你 在 考虑 及 & RR 是否 正确 ， 
那 就 开始 走 上 正轨 了 . 我 们 要 用 到 表达 式 x 4 x, 这 意味 着 要 对 x 有 所 选择 . z = R 
很 自然 地 成 为 一 个 被 考察 的 候选 对 象 , 因为 它 涉及 我 们 要 研究 的 东西 (并 且 在 分 析 
中 研究 是 很 不 错 的 尝试 ). 这 里 有 两 种 可 能 的 情况 : 要 么 尺 在 尺 中 , 要么 尺 不 在 
尺 中. 
。 首先 , 假设 尺 在 尺 中 . 由 于 我 们 假设 尺 eR 尺 ,并 且 尺 是 由 那些 不 属于 自身 
的 对 象 构 成 的 , 所 以 由 及 的 定义 可 知 , 有 R 4 RR. 但 这 是 很 荒 雇 的 . 及 Re 入 和 
及 & 尺 怎么 可 能 同时 成 立 呢 ? 因此 , 假设 尽 在 尺 中 是 错误 的 . 
e。 唯一 可 能 的 情况 是 有 R 不 在 有 R 中 . 现在 来 讨论 这 种 情况 . 正如 我 们 已 经 说 过 
的 , 及 是 由 全 体 不 属于 自身 的 东西 构成 的 集合 . 我 们 现在 假设 及 4 人 R, 但 是 
从 定义 上 来 看 , 这 正 是 R 中 元 素 所 满足 的 条 件 ! 同样 地 , 我 们 得 到 了 苞 座 的 
结论 , 即 尺 e 入 和 人 尺 &R 同时 成 立 . 
换 句 话说 , 在 任何 一 种 情况 下 , 我 们 都 得 到 了 奇怪 的 情形 : 当 RR 4 RR 时 恰 有 
尺 E 尺 . 这 意味 着 什么 呢 ? 这 意味 着 , 我 们 可 以 用 集合 做 什么 的 观念 一 一 更 具体 地 
说 , 我 们 如 何 从 旧 和 集合 中 构造 新 集合 的 观念 一 一 具有 致命 的 缺陷 . 这 一 悖 论 的 解 
决 为 现代 集合 论 黄 定 了 基础 . 从 罗素 导论 中 可 以 推出 一 个 结论 , 那 就 是 我 们 无 法 通 
过 简单 地 收集 具有 给 定性 质 的 所 有 对 象 来 形成 集合 . 幸运 的 是 , 我 们 在 概率 论 中 过 
到 的 绝 大 多 数 集合 都 没有 这 个 问题 , 但 重要 的 是 意识 到 潜在 的 危险 , 并 且 要 正确 、 
认真 地 理解 证 明 . 
现在 我 们 已 经 意识 到 了 松散 定义 和 非 正式 论述 的 危险 , 让 我 们 重新 回顾 集合 论 
的 基础 , 并 了 解 讨论 概率 所 需 的 语言 . 


2.2 集合 论 综 述 


在 描述 概率 的 一 般 规律 之 前 , 我 们 必须 快速 地 了 解 集合 论 和 拓扑 学 中 的 一 些 事 
实 . 这 些 内 容 对 于 学 习 概率 语言 至 关 重 要 , 而 概率 语言 是 理解 整 门 学 科 的 重要 部 分 . 
如 果 你 不 熟悉 这 些 术语 , 那么 还 需要 付出 一 些 努 力 才能 了 解 它们 , 但 花费 的 时 间 和 
精力 会 在 以 后 产生 巨大 的 回报 . 想象 一 下 , 不 知道 各 种 生物 体 和 化 合 物 的 名 称 是 上 
不 了 生物 课 的 ! 数学 也 是 如 此 . 在 学 会 一 门 语言 之 前 , 我 们 什么 也 做 不 了 . 
如 果 想 讨论 事件 的 概率 , 那么 自然 会 涉及 取 定 某 些 大 型 集 9 并 对 其 子 集 指定 
概率 的 问题 . 令 人 惊讶 的 是 , 没有 一 种 通用 的 方法 可 以 将 概率 分 配给 每 个 子 集 , 并 


/ 


使 概率 函数 满足 某 些 “ 


节 中 简单 地 讨论 


考察 的 事件 . 为 上 


自然 ”条 件 . 这 与 巴 拿 赫 - 塔 尔 斯 基 悖 论 有 关 , 我 们 会 在 2.6 


的 一 些 基 本 事实 . 幸运 的 是 ， 


. 以 防 不 能 将 概率 一 致 地 分 配给 所 有 可 能 的 子 集 , 我 们 必须 留意 要 
, 我 们 需要 集合 论 和 (点 集 ) 拓扑 中 


这 些 基本 关系 足以 应 付 概率 论 入 门 课 中 遇 到 的 所 有 对 象 . 对 


还 需要 o 代数 的 术 

我 们 从 一 些 基本 的 定义 和 集合 性 
你 对 其 中 许多 性 质 应 该 并 不 陌生 . 令 
元 素 . 如 果 a 是 A 


示 这 些 集合 中 的 


于 更 高 等 的 课程 , 我 们 
念 , 这 一 点 也 会 在 2.6 节 中 进行 简单 讨论 
质 开始 . 虽然 不 同 的 书 会 使 用 不 同 的 符号 , 但 


4, B,C,… 表示 集合 , 并 让 a,b,c,.… 分 别 表 


中 的 一 个 对 象 , 那么 我 们 就 说 a € A( 读 作 “a 


是 4 的 一 个 元 素 ”“a 在 4 中 ”或 者 “a 属于 A”); 若 a 不 包含 在 4 中 , 则 


a 4 4. 例如 , 如 果 4 是 个 
世界 大 赛 的 球 队 所 构成 的 集合 , 那么 波士顿 红 袜 队 前 
不 在 4 中 一 一 至 少 写本 书 时 如 此 .遗憾 的 是 , 通常 很 难 帮 
个 特定 的 集合 中 . 如 果 4 是 所 有 至 多 


有 数 集 ， 那么 24 


A, 但 25 4 A， 如果 4 是 由 全 体 启 过 
在 A 中 ， 


但 西雅图 水 手 队 则 


定 一 个 对 象 是 否 在 某 


能 写成 两 个 素数 之 和 的 偶数 的 集合 , 那么 有 


个 简单 的 方法 来 验证 某 个 给 定 的 数 是 否 属 于 4, 但 其 计算 成 本 很 高 .容易 看 出 ， 
4,100 和 1864 都 在 4 中 , 因为 4=2+2,100=47+53 且 1864= 3 十 1861; 那么 
24 60120 131 701 十 20131!24 601 . 1701! 十 32012! 呢 ? 著名 的 哥 德 巴赫 猜想 提 到 , 每 一 个 


正 偶数 都 在 这 个 集合 中 , 然而 我 们 距离 训 
如 果 4 的 每 个 元 素 都 在 B 
也 可 以 说 B 是 4 的 超 集 , # 


E 明 这 一 点 还 有 很 长 的 路 要 走 . 
pb, 我 们 就 说 4 是 B 的 一 个 子 集 , 并 记 作 4 cB. 
记 作 B > 4. 值得 注意 的 是 , 有 些 书 使 用 的 符号 稍 有 


不 同 . 例如 , 对 某 些 作者 来 说 , 4 C B 意味 着 不 仅 4 包含 在 B 中 , 而 且 B 中 有 一 
些 元 素 不 属于 4, 这 表明 了 包含 是 严格 的 . A C B 包含 7? 4cCB 和 A444=B 两 层 


AN AN pr 一 本 
含义 ; 这 个 符号 


清晰 , 但 通常 很 少 使 用 . 按照 类 1 


是 , 4 CG B 表示 


A 是 B 的 一 个 子 集 , 但 4 不 等 


包含 在 B 中 , 但 不 提 


以 的 方式 , 男 一 个 关于 符号 的 约定 
FB. 对 我 们 而 言 , 4C B 表示 4 


F 除 4 等 于 B 的 可 能 性 . 我 们 为 什么 要 这 样 做 ? 原因 是 我 们 并 


不 清楚 是 否 已 经 排除 了 相等 的 可 能 性 . 回 到 棒球 的 例子 , 如 果 B 是 所 有 棒球 队 的 


集合 , 而 4 是 所 


有 赢 过 世界 大 赛 的 棒球 队 的 集合 , 那么 4 c B. 这 是 一 个 真子 集 ， 


因为 有 些 球 队 还 没 遍 过 世界 大 赛 ; 但 这 个 结论 是 如 


出 的 , 否则 你 并 不 清楚 它 是 不 
最 重要 的 集合 之 一 是 空 集 , 它 是 唯 


下 都 是 空 集 的 例子 . 


。 4 是 全 体 大 于 1000 的 


轴 素 数 | 


的 集合 . 那么 A = %. 


E 你 了 解 一 些 棒球 历史 的 前 提 下 得 
是 一 个 真子 集 . 也 许 水 手 队 会 改写 这 个 历史 ……… 
没有 元 素 的 集合 . 我 们 把 空 集 记 作 gg， 以 


。4 表示 在 《辛普森 一 家 》 中 , 一 只 手 有 5 根 手指 的 人 构成 的 集合 . 那么 4 = %， 
这 是 因为 所 有 人 的 每 只 手 都 只 有 4 根 手指 . 再 看 另 


《老友记 》 中 ， 
集 构成 集合 记 作 4. 那么 4 = 2, 因为 所 有 剧 集 的 开头 都 有 The One( 除 


Rs 


局 | 


2 


除了 第 一 季 和 最 后 一 季 以 外 , 片头 没 出 现 ; 


电视 节目 的 例子 , 在 
过 The One 的 所 有 


| 
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合 何 时 相等 的 重要 问题 . 下 面 是 一 种 常用 的 方法 : 


B 且 BC 4 就 行 了 . 如 果 这 两 个 包含 关系 成 立 , 那么 4 的 所 有 元 素 都 在 B 中 , 征 B 


了 试播 集 和 最 后 一 集 )， 
。 设 4 是 一 个 正 整 数 的 集合 ， 


显然 , 但 它 是 数论 中 


它 的 每 个 元 素 都 无 法 写成 四 个 平方 的 和 、 三 个 
平方 的 和 、 两 个 平方 的 和 或 一 个 平方 和 的 形式 . 那么 4 = gg. 这 个 结果 并 不 
个 非常 好 的 结论 . 例如 , 把 1729( 数 学 中 非常 重要 的 一 
个 数 ) 写成 4 个 平方 之 和 的 方法 之 一 是 22 +32 十 102 十 402. 另外 , 我 们 有 70 
种 方法 可 以 把 2013 写成 2 十 已 十 如 十 a? 的 形式 , 其 中 d<c<b<a. 例 


如 , 2013 = 82 + 162 + 182 + 372. 对 于 2014 来 说 , 共有 72 种 表示 方法 , 2015 


有 61 种 方法 , 而 2016 只 有 8 利 


表示 方法 , 但 2017 有 53 种 方法 . 


空 集 显然 是 独一无二 的 , 尽管 它 有 很 多 不 同 的 表示 方法 .这 就 引出 了 两 个 集 


要 想 证 明 A = B, 只 需 证 明 A c 


的 所 有 元 素 也 都 在 4 中 , 所 以 它们 一 定 是 相等 的 . 
给 定 两 个 集合 4 和 B, 我 们 可 以 构造 出 几 个 新 的 集合 . 


(1) AUB: 读 作 “A 并 B”. 


它 是 由 4 和 B 中 所 有 元 素 构成 的 集合 , 某 些 元 


素 可 能 会 同时 存在 于 两 个 集合 之 


P. 这 个 集合 记 作 
AUB = {rz:zehA 或 ze B}. 


对 于 多 个 集合 , 我 们 也 可 以 得 到 它们 的 并 ( 集 ). 我 们 可 以 用 几 种 方式 来 表 
示 : 如 果 是 有 限 个 集合 的 并 , 可 以 写成 A1U A2U…U An 或 者 U2_14;; 如 
果 是 无 限 个 集合 的 并 , 可 以 写成 ug 4;. 还 可 以 使 用 一 种 同时 适用 于 每 个 


集合 的 符号 : Uier4i. 这 里 的 了 工 可 能 是 一 个 有 限 集 , 也 可 能 是 个 无 限 集 . 例 
如 , 考虑 4= {1,2,3} 和 B= 12,3, 分 ,于 是 4U = {1,2,3,4}. 


(2) ANn B: 读 作 “A 交 B”. 
这 个 集合 记 作 


ANMB = {xz: x 


它 是 那些 同时 存在 于 4 和 B 中 的 元 素 的 集合 . 


A 并 HH x eB}. 


对 于 多 个 集合 , 我 们 也 可 以 得 到 它们 的 交 ( 集 )， 这 里 的 符号 与 上 述 相 似 : 
对 于 有 限 个 集合 的 情况 , 我 们 记 作 A1n4AsNn…n4; 或 者 ?14;; 对 于 无 限 


个 集合 的 情况 , 我 们 记 作 nhi;, 或 者 更 一 般 的 Nierhi. 如 果 4NnB= 9%， 


就 说 集合 4 与 集合 B 是 不 相交 的 . 如 果 对 于 任意 的 jkeET 且 j 关 %, 均 


有 4j nAx = ,那么 就 说 集 族 {4i;}ier 中 的 集合 是 两 两 不 相交 的 . 回 到 


4={123} 和 巨 =1{12,3,4}, 我 们 有 4DmB={12,3}. 


(3) 4c: 


概念 中 , 这 是 最 难 理解 的 , 因为 我 们 需要 知道 4 是 什么 . 


称 为 4 的 补 集 . 它 是 全 体 不 在 4 中 的 元 素 的 集合 . 在 集合 论 的 所 有 


旦 有 可 能 出 现 


混淆 , 我 们 就 要 设法 让 这 个 符号 更 精 
于 是 我 们 经 常 把 4e 记 作 了 X\ 4. 如 


. 如 果 和 是 整个 空间 , 那么 A CX， 


果 想 让 补 集 更 加 明确 , 就 需要 弄 清楚 
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X 是 什么 也 就 是 说 , 我 们 关于 什么 取 补 集 . 例如 , 考察 整数 集 2 的 
子 集 , 设 4 是 全 体 偶 数 构成 的 集合 . 那么 4* 是 全 体 奇 数 的 集合 . 另 一 方 
面 , 如 果 我 们 考察 的 是 实数 集 的 子 集 , 而 4 是 偶数 集 , 那么 4e 就 不 仅仅 
是 奇数 集 了 ! 
(4) Ax B: 称 为 4 和 B 的 箔 卡 儿 乘 积 . 它 是 全 体 有 序 对 (a,。) 的 集合 , 其 中 

ae A 有 日 be B. 当 4=B 时 , 我们 通常 用 A4? 来 表示 4 x 4. 更 一 般 地 ， 

如 果 有 nn 个 4 相 乘 , 则 记 作 4"*. 最 常见 的 例子 是 R* 和 C”, 它们 分 别 
是 全 体 n 元 实数 组 的 集合 与 全 体 n 元 复数 组 的 集合 . 如 果 4 = {1,2} 且 
B = {2,3,4}, 那么 


AxB = {(1,2),(1,3),(1,4),(2,2),(2,3), (2,4)}. 
次 序 在 这 里 很 重要 , (1,3) e 4 x B, 但 (3,1) 不 属于 4 x B. 给 一 个 口头 上 
的 解释 , 先 向 东 走 一 个 街区 再 向 北 走 三 个 街区 , 与 先 向 东 走 三 个 街区 再 向 
北 走 一 个 街区 是 不 一 样 的 . 留意 一 下 4 x B 中 元 素 被 列 出 的 顺序 . 我 们 可 
能 会 写成 4 x B = {(1,3), (2,3), (2,2), (1,2), (1,4), (2,4)}. 虽然 这 两 种 写 
法 都 是 4 x B， 0 于 第 一 种 写法 . 为 什么 ? 这 是 一 种 非常 优美 
是 有 条 理 的 元 素 枚 举 方法 . 第 二 种 看 起 来 更 加 随意 且 没 有 特定 的 顺序 , 从 
而 可 能 会 有 遗漏 元 素 es 
(5) P(A4): 称 作 4 的 寡 集 . 它 是 4 的 所 有 子 集 的 集合 . 如 果 4 = {x, 人 四, 那 
么 P(4) = {@2,{z}), {中 ,4A}. 注意 , P(4) 中 的 元 素 自 身 就 是 集合 . 
我 们 来 看 更 多 的 例子 . 除 以 2010 后 余数 为 i 的 全 体 整 数 的 集合 记 作 4,;, 于 是 
415 = {:… ,一 1995,15, 2025,.…}, 这 意味 着 2025 e A1s, 但 2024 不 属于 415. 有 些 
人 认为 


2009 
AoU A1U:..U A2009 = U 4; 


就 是 全 体 整 数 的 集合 , 原因 是 任何 整数 除 以 2010 后 都 必须 有 余数 . 余数 可 以 是 0， 
., 2009. 由 于 我 们 已 经 考虑 了 所 有 可 能 的 情况 , 因此 这 个 并 就 是 整数 集 . 
下 面 这 个 交 呢 ? 


2009 
4on4in…na4aoo = 门 4 
t=0 
这 是 除 以 2010 后 余数 不 但 等 于 0, 而 且 等 于 1, 2, … 的 全 体 整 数 的 集合 . 因为 每 个 
数 都 只 有 唯一 的 余数 , 所 以 这 个 交 是 空 集 . 实际 上 , 不 存在 除 以 2010 后 余数 既 为 0 
又 为 1 的 整数 , 因此 hon 4i = gg. ho 和 A1 可 以 推广 到 一 般 的 情形 ; 如 果 j 冯 久 ， 
那么 4 nA; = 2. 事实 上 , 集 族 {4;}2009 中 的 集合 是 两 两 不 相交 的 . 
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对 于 究 集 , 如 果 4 = {zx,y,2z}, 那么 P(A) = {2, {x}, {vy}, {2}, {x,Yy}, {x, 2 
{vy,z}, 4A}. 我 们 首先 列 出 了 含有 0 个 元 素 的 4 的 子 集 , 然后 是 恰 含 一 个 元 素 的 子 
集 , 接着 是 正好 包含 两 个 元 素 的 子 集 , 直到 最 后 列 出 4 自身 . 如 果 4 是 有 限 集 , 那 
么 P(A) 的 元 素 个 数 就 是 2#4( 其 中 #4 表示 4 中 元 素 的 个 数 ). 理解 这 一 点 最 简 
单 的 方法 是 , 对 于 4 的 某 个 给 定子 集 , 4 中 的 每 一 个 元 素 要 么 在 这 个 子 集中 , 要 么 
不 在 . 因此 , 当 创 建 子 集 时 , 对 于 4 的 每 一 个 元 素 , 我 们 都 有 两 种 选择 (选取 该 元 素 
或 不 选取 它 ), 于 是 4 共有 2#4 个 可 能 的 子 集 . 

一 个 有 趣 的 问题 是 怎样 以 严格 的 、 集 合 论 的 方式 来 构造 整数 集 (或 者 更 一 般 地 ， 
构造 实数 集 ). 令 人 惊奇 的 是 , 在 只 有 一 个 空 集 的 前 提 下 就 可 以 实现 这 一 点 ! 我 们 可 
以 利用 空 集 &g 来 构造 一 个 集合 , 即 {2g}( 包 含 空 集 的 集合 ). 按照 这 种 方法 , 我 们 还 
能 构造 出 {&2, {2}}, 继续 进行 下 去 又 得 到 了 {8g, {2}, {8, {82}}}. 如 果 让 &g 对 应 于 
0, {2] 对 应 于 1, {8,{2}} 对 应 于 2, 等 等 , 那么 不 难看 出 , 每 个 “ 数 ” 都 是 比 它 大 
的 那个 数 的 真子 集 (因此 , 集合 的 包含 关系 相当 于 “小 于 ”). 


2.2.1 ”编程 漫谈 


本 书 的 一 个 重要 主题 是 培养 良好 的 编程 能 力 ， 下 面 简短 地 讨论 一 下 前 面 的 一 
个 例子 : 把 一 个 数 写 成 4 个 平方 数 之 和 . 我 们 给 出 两 个 简短 的 程序 来 计算 把 一 个 整 
数 写成 4 个 平方 数 之 和 十 已 十 中 十 qa? 的 方法 数 ,其 中 dqd<c<b<a. 

编码 的 方法 有 若干 种 . 我 们 首先 给 出 一 个 高 效 的 方法 : 与 简单 的 程序 相 比 , 它 
写 起 来 会 花费 更 多 时 间 , 这 是 因为 我 们 必须 考虑 一 些 语句 的 上 限 , 但 它 的 运行 速度 
要 快 得 多 . 然后 , 我 们 给 出 一 个 运行 速度 较 慢 但 较 简明 的 程序 . 如 果 你 考察 的 是 一 
个 较 小 的 数 , 比如 2000, 那么 使 用 哪个 程序 都 可 以 (第 二 个 程序 写 起 来 更 容易 ); 当 
数 较 大 时 , 这 两 个 程序 的 差异 就 非常 惊人 了 : 如 果 考 察 的 数 是 20 000, 那么 高 效 的 
程序 只 需要 运行 7.5 秒 , 但 较 慢 的 则 需要 48.7 秒 ; 当 数 为 40 000 时 这 一 差距 会 更 
大 , 第 一 个 程序 只 需 22.6 秒 , 但 第 二 个 程序 要 花费 194.2 秒 . 这 说 明了 一 个 重要 原 
则 : 如 果 你 要 重复 做 某 事 很 多 遍 , 或 者 这 个 程序 需要 一 段 时 间 来 运行 , 那么 花 点 时 
闻 改 进 代码 是 很 有 价值 的 . 神奇 的 是 , 重新 写 几 个 for 循 环 就 可 以 帮 有 我 们 节省 很 多 
时 间 . 

第 一 个 程序 (高 效 但 代码 较 长 ): 
sumfoursquares[m_, print_] := Module[{}, 
(* m 是 我 们 要 考察 的 数 *) 
(* 将 计算 m = ar2 + b*2 + c*2 + d"2 的 概率 *) 
(* 其 中 a >=b >= c >= d *) 
(* 如 果 参 数 print 等 于 1 就 输出 所 有 有 效 的 四 元 组 {a,b,c,d} *) 
count = 0; (* 计算 m 可 以 写成 4 个 平方 数 之 和 的 概率 *) 


list = {}; (* 这 里 存储 有 效 的 四 元 组 *) 
(* 下 面 几 行 是 高 效 的 循环 *) 
(* 我 们 希望 a >=b>=c>=d 
所 以 可 以 利用 这 一 点 来 限制 for 循 环 *) 
(* 这 样 我 们 就 不 必 计 算 不 需要 的 情况 *) 
(* 注意 b 不 能 大 于 a， 而 且 必 须 小 于 Sqrt (m-a*2) *) 
(* 这 样 我 们 就 限制 了 for 循 环 ， 程序 也 运行 得 更 快 *) 
For[a = 0, a <= Sqrt[m], at++, 
For[b = 0, b <= Min[a, Sqrt[m - a*°2]], b++, 
For[c = 0, c <= Min[b, Sgrt[m - a°2 - b*2]], c++, 
{ 
(* 这 样 d 就 是 我 们 想 要 的 那个 使 得 m = a~2+b*2+c*2+d"2 的 数 *) 
(* 接 下 来 确保 d 是 一 个 不 大 于 c 的 整数 *) 
(* 在 Mathematica 中 检查 一 个 数 是 否 为 整数 很 简单 一 一 
利用 IntegerQ *) 
(* 如 果 满 足 条件 ， 则 计数 加 1 并 保存 {a,b,c,d} 的 值 *) 
d= Sgqrt[lm - a2 - b*2 - c°2]; 
If[d >= 0 && d <= c && IntegerQ[d] == True, 
{ 
count = count + 1; 
list = AppendTo[list, {a, b, c, d}]; 
外 ; (* 结束 if 循 环 *) 
门 ; (* 结束 对 c 的 循环 *) 
]]; (* 结束 对 b 和 a 的 循环 *) 


Print ["The number of representations of ", m, 

"as a sum of four squares with a >=b>= cy>= dis ", count, "."]; 
If[print == 1, Print[list]]; 
] 


第 二 个 程序 (速度 较 慢 但 易于 编码 ): 


slowsumfoursquares[m_, print_] := Module[{}, 


count = 0; 
For[a = 0, a <= S$qrt[m] ，a++， 
For[b = 0, b <= a, b++, 
For[c = 0，c <= b, c++, 
For[d = 0, d <= c, d++, 
If[a*2 + b*2 + c”2 + d"2 == m， 
{ 
(* 与 上 一 个 程序 不 同 ， 需 要 验证 的 条 件 更 少 *) 
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(* 注意 ， 这 里 没有 使 用 IntegerQ 函数 *) 

(* 它 包含 4 个 for 循 环 ， 而 不 是 3 个 *) 

count = count + 1; 

list = AppendTo[list, {a, b, c, d}]; 

后; 

]]]] ; 

Print ["The number of representations of ", m, 
"as a sum of four squares with a >=b >=c >= d 
If[print == 1, Print[list]]; 
] 


2.2.2 “无穷 大 的 大 小 和 概率 


is ", count, "."]; 


本 小 节 值 得 一 读 , 但 对 于 许多 课程 来 说 , 不 必 重 点 学 习 这 里 的 所 有 定义 . 引入 
这 部 分 内 容 是 为 了 保持 完整 性 并 照顾 大 部 分 读者 的 兴趣 , 同时 也 是 为 高 等 课程 做 准 
备 . 


集合 论 的 一 个 重要 结果 是 存在 不 同 程度 的 无 穷 大 


的 吗 ? 事实 证 明 , 答案 是 响亮 的 “不 ”. 实际 上 , 有 一 和 


门 所 说 的 无 限 集 的 大 小 是 什么 意思 呢 ? 任意 两 个 无 限 集 的 “大 小 ”不 应 该 都 是 一 样 


. 乍 一 看 , 这 似乎 很 奇怪 ; 我 


方法 可 以 比较 无 穷 大 ; 与 我 


门 的 直觉 相反 , 有 些 无 穷 大 要 比 其 他 的 无 穷 大 更 大 . 在 本 小 节 中 , 我 们 将 讨论 无 穷 


理解 为 什么 我 们 要 研究 某 些 集合 . 
在 描述 不 同 的 无 穷 大 之 前 , 我 们 先 给 出 一 些 符号 . 
的 输入 对 应 到 不 同 的 输出 ， 

有 f(z) = jg 如果 设 f(z) = zz, 那么 f: [0,2] 一 
了 : [2,2] 一 [0,4 就 不 是 (参见 图 21 上 图 ). 请 注意 ， 


大 的 阶 以 及 概率 的 含义 . 如 果 想 了 解 更 多 内 容 , 请 参阅 附录 C. 许多 入 门 书 只 是 简 
单 地 提 到 这 些 问 题 , 而 我 们 的 目标 是 提供 足够 的 细节 来 让 你 了 解 这 门 课 , 并 帮助 你 


如 果 函 数 f : 4 一 B 将 不 同 


那么 称 f 是 一 对 一 的 函数 . 这 意味 着 仅 当 z = y 时 才 


[0,4] 是 个 一 对 一 的 函数 , 但 
定义 域 在 判定 函数 是 否 为 一 


对 一 中 发 挥 着 重要 作用 . 有 些 书 使 用 单 射 这 个 词 来 代替 一 对 一 . 
我 们 需要 的 另 一 个 概念 是 映 上 (或 满 射 ) 函数 . 如 果 对 于 任意 给 定 的 5e B, 都 
存在 一 个 ae 4 使 得 f(a) = 。b, 那么 就 称 f : 4 一 B 是 映 上 的 (或 满 射 ). 例如, 定 


义 为 f(z) = z2 的 函数 :|0,2] 一 [0,4 就 是 满 射 (从 而 有: [-2,2] 一 10, 和 也 


满 射 ); 要 想得到 这 一 点 , 只 需 令 a = Vb. 但 是 , 如 果 函 数 变 成 被 定义 为 f(x) = 
的 了: [0,2] 一 [--4, 句 , 那么 情况 就 不 一 样 了 . 虽然 有 相同 的 对 应 法 则 , 即 输出 平 7 


数 , 但 此 时 我 们 的 函数 不 是 映 上 的 , 因为 任何 输入 被 平 
负数 . 


是 
x2 
万 
方 后 得 到 的 输出 都 不 可 能 是 


2.2 集合 论 综述 51 


0.5 


图 2-1 ”( 上 图 ) 被 定义 为 f(x) = z2 


工人 a 2.0 
的 函数 了 : [2,2] 一 [0,4] 是 满 射 但 不 是 单 


射 . (下 图 ) 被 定义 为 f(x) = zx? 的 函数 f : [0,2] 一 [0,4 是 双 射 


最 后 , 如 果 f 既是 一 对 一 的 又 是 映 上 的 , 那么 我 们 就 说 f 是 双 射 . 4 = [0,2] 且 
B = [0,4] 的 平方 函数 f(x) = z2 是 个 双 射 (参见 图 2-1 下 图 ); 如 果 B = [4, 身 , 那 


就 不 是 双 射 了 . 


如 果 集合 4 中 的 元 素 与 集合 {1,2,…… 


有 了 这 些 符号 后 ,就 可 以 讨论 集合 的 大 小 了 .集合 的 大 小 依次 为 有 限 、 可 数 
和 不 可 数 (我 们 不 必 担 心 不 可 数 的 不 同 级 别 ). 我 们 的 目标 不 是 写 一 本 “集合 论 读 
本 ”一 一 至 少 现在 是 这 样 的 ! 所 以 我 们 只 做 个 简短 的 介绍 , 更 多 讨论 请 参阅 附录 C. 


,n} 之 间 存在 一 一 对 应 的 关系 , 那么 就 说 4 


是 大 小 为 n( 或 基数 为 n) 的 有 限 集 此 时 , 可 以 把 4 写成 4 = {a1,a2,… ,an}. 更 
正式 地 说 , 我 们 有 一 个 函数 f: {1,2,… 


,中 一 4 它 使 得 任意 两 个 不 同 的 整数 都 对 


应 到 4 中 的 不 同 元 素 ; 并 且 对 于 任意 给 定 的 元 素 a € 4, 存在 某 个 Re {1,2,:… ,n}， 


大 小 . 可 数 集 不 仅 有 无 穷 多 个 元 素 , 而 


使 得 f(k) = a. 也 就 是 说 , 这 两 个 集合 之 间 存 在 一 个 双 射 . 如 果 在 4 和 正 整数 集 之 
间 存 在 一 个 既是 一 对 一 的 又 是 映 上 的 函数 户 就 说 集合 4 是 可 数 的 . 如 果 4 既 不 
是 有 限 的 , 也 不 是 可 数 的 , 那么 说 它 是 不 可 数 的 . 我 们 用 #4 或 者 |4| 来 表示 4 的 
且 它 的 大 小 是 最 小 的 无 穷 大 . 
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率 定律 


显 


有 


集 


sy 


集 已 的 例子 就 可 以 说 


男 数 , 即 f(x) = zx/2. 


然 , 任意 可 数 集 都 比 他 


明 这 一 
因此 , 一 日 


显 


《AN 


E 意 有 限 集 大 . 令 人 惊讶 的 是 , 如 果 4 是 B 的 


p AG B), 那么 |4| = 1B| 是 可 能 发 生 的 . 下 面 这 个 关于 正 介 
然 , 妃 S P, 但 是 存 看 
每 一 个 元 素 都 与 已 中 


然 . 这 就 是 说 已 和 PP 有 相同 大 小 的 原因 . 


在 集合 论 课 上 , 我 们 证 明了 正 整数 集 、 整 数 集 乙 、 有 理 
,Tn) : zi € Q} ( 即 全 体 n 元 有 理 数组 的 集合 ) 具有 相同 的 大 小 . 这 些 集 
都 是 可 数 的 . 另 一 方面 , 实数 集 及 、 平 面 
Fh 卓越 方法 , 即 所 谓 的 对 角 
合 论 教材 . 另外 , 关于 可 数 信 
的 内 容 后 , 我 希望 你 能 
正如 我 们 将 在 2.6 节 中 看 到 的 
可 数 个 事件 的 并 , 我 们 无 法 讨论 


{(z1, pi 


证 明 采用 了 康 托 尔 
阅 任何 一 本 完整 的 集 
读 完 上 而 


察 的 集合 是 什么 样 的 . 
开 集 和 闭 集 

我 们 
闭 集 . 


2.2.3 


了 王 
x 


形 下 的 结果 对 于 多 元 函数 的 研究 至 关 重 要 , 尤 


化 简 复 杂 的 积分 时 . 
常见 的 区 间 共 有 
e [a,b| := {x €] 
e [a,b) := {x €] 
e (a,b| := {x €] 


的 一 


四 种 : 
R:a<zr<ob} 
R:a<z<o0b} 
R:a<7z<0b} 


利 


你 可 能 还 记得 这 个 微 积分 如 


多 数 入 门 课程 都 不 太 关 注 一 般 的 ' 


p 


有 数 集 媚 和 1 


个 真 


FE 整数 


数 集 Q 以 及 Q" 


有 2 和 7 维 空间 及 ”都 


个 从 瑟 到 忆 的 一 对 一 
的 唯 一 元 素 相 匹配 , 反之 亦 


是 不 5 


化 论证 . 要 


了 解 更 多 


人 


的 更 多 内 容 ， 


考虑 这 样 一 个 问题 : 
, 只 能 讨论 可 数 个 事 人 
概率 . 这 里 


请 参阅 


了 解 的 最 后 一 个 术语 是 开 区 间 和 闭 区 间 一 一 或 者 更 


e (a,b):= {zrER:a<z<o0b} 


口 


( 
叫 作 开 区 间 ， 


FP RR 是 实数 集 )， 第 一 种 [a,5 
因为 它 不 包含 两 个 端点 . 


必 


叫 作 闭 区 间 ， 


第 二 种 和 


般 


J] 数 的 . 这 上 


附录 C. 
这 和 概率 有 什么 关系 呢 ? 
的 并 的 概率 . 也 就 是 说 , 对 于 不 
的 讨论 是 为 了 让 我 们 知道 概率 论 上 


FP 考 


也 说 成 开 集 和 
的 概念 , 不 过 还 是 快速 地 看 看 下 面 的 定义 . 绝 大 


吊 


Be 


个 


间 . 我 们 会 经 常 给 实 直 线 的 子 集 


果 理解 了 这 些 集合 的 


时 率 , 那么 到 


由 


思 晶 
和 


全 


开 


区 间 和 闭 


本 成 分 应 该 是 什么 ? 或 者 说 , 我 们 


儿 乘 积 : 在 二 维 


空间 


考察 和 


区 间 是 研究 实 直 线 及 的 理 


既 率 ,而 这 


上 5 


要 


相 


UN 


处 理 的 所 有 集合 


应 该 如 


何 


a 


口 


E 形 , 在 三 维 


日 


[dxled, BM {mW) :a<r hesy 


个 区 间 [e, 有, 但 


间 中 考察 方 盒 , 等 
. 如 果 推 广 到 三 维 


<d} 


i 广 区 间 ? 一 个 不 错 的 选择 是 使 
等 ， 例 如 , 考察 集合 


因为 它 包含 了 两 个 端点 . 最 后 一 利 
种 都 被 称 为 半 开 
区 间 就 是 构建 块 . 换 名 话说 , 如 


工具 , 但 是 R? 和 R” 呢 ? 它们 的 基 


青 形 , 而 是 把 精力 集中 于 直线 上 的 区 间 . 更 高 维 情 
其 是 当 我 们 想 要 使 用 变量 替换 公式 来 


h 


区 间或 半 闭 区 


空间 , 可 以 添 放 


这 会 变 得 很 乱 . 当 考 察 更 高 


侍 的 情形 时 , 就 会 日 


用 笛 卡 


上 另 一 


上 现 一 堆 乱 粳 


的 字 


母 . 为 了 保持 符号 的 整洁 , 考虑 下 面 这 种 形式 : 
[al b1] XX [an, bn] 人 {(zZz1 , Tn) ~ Ui < Ti < bi}. 

这 是 描述 R” 中 集合 的 一 个 简洁 方法 . 我 必须 强调 好 符号 的 重要 性 和 必要 性 . 好 的 
符号 可 以 让 你 轻松 地 了 解 究 竞 发 生 了 什么 , 而 糟糕 的 符号 会 让 你 摸 不 着 头脑 , 生 着 
气 不 停 抱怨 (这 很 不 利于 学 习 ). 有 必要 花 一 些 时 间 去 想 想 , 怎样 的 表达 能 最 好 地 呈 
现 出 你 的 想法 . 你 希望 人 们 能 够 理解 你 所 说 的 话 . 看 看 用 这 种 符号 来 描述 R" 中 的 
方 盒 有 多 么 整洁 , 如 果 写 成 [a, 09] x [c, qd] x [le 月 x…… 那 就 做 不 到 这 一 点 了 . 事实 上 ， 
我 们 应 该 把 R? 看 成 作 RR x 民 , 或 者 全 体 实数 对 的 集合 . 同样 地 , R3 就 是 及 xx 及 x 疏 ， 


条 和 包 
虽然 矩形 和 方 盒 很 实用 , 但 它们 并 不 是 唯一 的 选择 . 另 一 种 可 能 的 选择 是 在 平 
能 更 好 地 组 合 在 


面 上 使 用 圆 , 在 三 维 空间 中 使 用 球 . 这 两 种 方法 都 是 有 用 的 : 和 矩形 
一 起 , 而 圆 和 球 更 便于 理论 计算 . 

在 实践 中 , 我 们 可 能 需要 研究 三 维 以 上 空间 中 集合 的 概率 . 例如 , 现在 有 一 个 
经 济 模型 , 它 有 10 个 参数 , 我 们 想 知道 能 导致 某 个 特定 结果 出 现 的 参数 值 的 大 小 
或 概率 . 为 了 研究 这 种 情况 , 使 用 一 些 在 所 有 维度 上 都 通用 的 符号 是 很 方便 的 . 为 
了 给 概率 一 个 真正 坚实 的 基础 , 我 们 需要 这 种 符号 ; 然而 , 对 于 许多 课程 来 说 , 重点 
是 采用 一 种 更 加 通俗 易 懂 的 方法 , 因此 这 些 概念 可 能 不 会 被 提 及 . 

我 们 把 半径 为 +、 球 心 为 a = (a1,… ,an) ER" 的 开 球 定义 为 

Ba(r) := {z=(z ,En) : (F101) ++ (vn aan) <r2}. 

闭 球 Bo(7) 可 以 按照 类 似 的 方法 来 定义 , 只 需要 把 < 替换 成 < 就 行 了 . 因此 , 开 球 
是 与 a 点 的 距离 小 于 7 个 单位 的 所 有 点 的 集合 , 也 可 以 把 它 看 作 球 心 为 a、 半 径 为 
7 的 n 维 球 体 中 所 有 点 的 集合 . 设 4 c R”, 如 果 对 于 任意 给 定 的 os 4, 都 存在 1 
个 7( 取 值 依赖 于 a) 使 得 Bu(r) c 4, 那么 就 说 集合 4 C R" 是 开 的 . 此 外 , 如 果 4 
的 补 集 是 开 的 , 那么 4 就 是 闭 的 . 

考虑 下 面 的 例子 : 设 4 是 所 有 满足 |zy| < 1 的 点 (x,y) € R? 的 集合 . 换 句 话 
说 , 4 对 应 着 图 2-2 中 区 域内 的 所 有 点 . 

为 了 证 明 这 是 一 个 开 集 , 我 们 任 选 其 中 一 点 来 考察 . 让 p 表示 从 这 一 点 到 四 条 
曲线 中 任意 一 条 曲线 的 最 短 距离 . 根据 微 积分 的 知识 , 我 们 认识 到 p 不 仅 存在 而 且 
大 于 0. 于 是 , 以 该 点 为 中 心 且 半径 为 p/2 的 球 就 包含 在 4 中 . 

下 面 是 两 个 最 常见 的 开 集 和 闭 集 的 例子 . 

。 一 个 没有 边界 的 圆 或 球 就 是 一 个 开 集 ; 如 果 把 边界 包括 在 内 , 就 得 到 了 一 个 

闭 集 . 
。 没有 边界 的 区 间 、 正 方形 和 立方 体 等 都 是 开 集 ; 类 似 地 , 包含 了 边界 的 区 间 、 
正方 形 和 立方 体 等 都 是 闭 集 . 


©O 


©O 


54 第 2 章 基本 概率 定律 


二 4- 
图 2-2 满足 |zy| < 1 的 点 的 集合 . 它 是 一 个 无 限 集 : 它 的 面积 是 有 限 的 还 是 无 限 的 


至 此 将 结束 有 关 术 语 的 这 个 节 , 我 们 承认 这 节 相 当 宛 长 . 我 们 需要 引入 大 量 术 
语 . 也 许 你 不 能 马上 看 到 它 的 价值 , 但 请 相信 我 , 它 是 有 价值 的 . 虽然 学 习 定义 并 不 
是 件 最 愉快 的 事 , 但 这 对 我 们 与 他 人 清晰 、 有 效 地 沟通 至 关 重 要 . 既然 我 们 已 经 花 
时 间 学 习 了 这 种 语言 并 确保 能 采用 同样 的 符号 , 那么 就 一 定 能 够 从 中 获 益 ! 

试 一 下 你 能 否 看 出 集合 是 不 是 开 的 . 设 4 是 所 有 满足 (z/4)2+(W3)2 <1 的 点 
(zx,y) 的 集合 , 证 明 4 是 开 的 . 如 果 B 是 所 有 满足 (z/ 和 2 二 (W3)2 < 1 的 点 (x,%) 
的 集合 , 那么 证 明 B 是 闭 的 . 
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本 节 在 开始 时 非常 简单 , 但 随 着 我 们 考察 的 问题 越 来 越 微 妙 , 其 内 容 也 会 在 技 
术 层 面 上 变 得 更 加 困难 . 要 想 解 决 其 中 一 些 问题 , 我 们 需要 用 到 分 析 学 和 点 集 拓扑 
的 知识 , 但 对 于 概率 论 入 门 课 来 说 , 这 没 必要 . 我 们 有 很 多 关于 概率 的 日 常 经 验 , 虽 
然 存在 被 误导 的 危险 (比如 罗素 悖 论 ), 但 在 大 多 数 情况 下 直觉 会 带 来 帮助 . 正如 本 
章 导 言 中 所 讨论 的 , 危险 总 是 围绕 着 无 穷 大 一 一 要 么 是 无 穷 多 个 集合 , 要 么 是 具 
有 无 穷 多 个 元 素 的 集合 . 只 要 出 现 无 穷 大 , 我 们 就 要 非常 小 心 ， 然而, 如 果 只 考虑 
有 限 多 个 集合 , 并 且 每 个 集合 都 包含 有 限 多 个 元 素 , 那么 我 们 的 直觉 通常 是 值得 信 
赖 的 ， 因此, 我 们 用 两 节 内 容 来 讨论 概率 公理 , 这 种 做 法 应 该 是 合理 且 正 确 的 . 本 
节 和 接 下 来 的 一 节 将 给 出 一 个 直观 的 方法 , 有 兴趣 了 解 技术 细节 的 读者 应 当 阅 读 
2.6 节 . 

先 将 我 们 使 用 的 直观 概念 形式 化 . 为 了 合理 地 谈论 概率 , 我 们 需要 一 些 信息 . 
首先 必须 指出 所 有 可 能 的 结果 以 及 每 个 结果 发 生 的 概率 . 
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我 们 假设 所 有 可 能 的 结果 都 是 某 个 给 定 集合 Q 的 子 集 . 因此 , 9 可 能 就 是 正 
整数 集 , 事件 就 是 抛 出 “正面 > 之 前 , 抛 硬币 的 总 次 数 . 另 一 个 例子 是 , 假设 Q 是 个 
单位 圆 , 事件 是 单位 圆 的 子 集 . 此 时 , 考虑 投掷 飞镖 的 情景 . 如 果 我 们 向 单位 圆 投 

飞镖 , 那么 它 就 要 在 某 处 着 陆 , 而 圆周 和 圆 内 的 每 一 点 都 是 可 能 的 着 陆 点 . 

我 们 把 9 称 为 样本 空间 或 结果 空间 , 并 把 中 的 元 素 称 作 事件 . 这 个 定义 在 
很 多 情况 下 都 适用 . 当 Q 是 有 限 集 或 者 可 数 集 时 , 这 个 定义 是 令 人 满意 的 . 不 过 ， 
对 于 一 般 的 概率 空间 , 这 个 定义 需要 进行 修改 , 就 像 我 们 在 2.6 节 中 讨论 的 那样 . 

旦 有 了 结果 空间 9, 我 们 就 想 为 9 中 的 不 同 元 素 指定 概率 . 为 此 , 我 们 引入 
概率 函数 , 并 把 它 记 作 Prob. 我 们 用 Prob(4) 来 表示 事件 4 发 生 的 概率 , 但 通常 
把 它 简 写成 Pr(4). 

下 面 给 出 一 个 例子 来 说 明 这 一 点 . 假设 老虎 机 的 第 一 个 轮 盘 上 有 20 个 符号 : 10 
个 梅花 、5 个 红 桃 、3 个 方块 和 2 个 黑 桃 . 在 我 们 玩 的 时 候 , 如 果 这 20 个 符号 中 的 
每 个 都 等 可 能 地 出 现 , 那么 样本 空间 和 概率 函数 分 别 是 什么 ? 

虽然 这 个 问题 看 似 简单 , 但 其 中 隐藏 着 一 些微 妙 之 处 . 这 里 存在 两 种 可 能 的 解 
释 : 我 们 能 区 分 清楚 具有 相同 符号 的 不 同 对 象 吗 ? 由 于 这 10 个 梅花 看 起 来 都 一 样 ， 
因此 假设 我 们 无 法 分 辨 这 10 个 梅花 之 间 的 区 别 也 是 很 合理 的 . 当 轮 盘 停 止 时 , 如 
果 看 到 一 个 梅花 , 那么 我 们 无 法 确定 它 是 第 1 个 还 是 第 10 个 . 

样本 空间 是 所 有 可 能 结果 的 集合 , 所 以 我 们 有 


0 = {@,0,0, 遇 }. 


由 于 这 20 个 对 象 中 的 每 个 都 等 可 能 地 出 现 , 因此 这 个 过 程 相当 简单 . 为 了 求 出 每 
种 符号 出 现 的 概率 , 我 们 要 做 的 就 是 计算 出 具有 这 种 符号 的 对 象 共 有 多 少 个 , 然后 
再 除 以 对 象 的 总 数 , 于 是 
2 5 3 10 
汪 Pr(0) = De Pr(®®) = 0 
关于 这 个 概率 函数 , 有 两 点 需要 注意 . 首先 , 每 个 概率 都 是 非 负 的 , 且 至 多 为 1. 这 
是 合理 的 一 一 一 件 事 发 生 的 概率 是 -0.5 或 2 意味 着 什么 呢 ? 把 结果 乘 上 100, 就 
可 以 将 概率 转换 为 百分比 的 形式 . 因此 , 0.5 的 概率 相当 于 50%, 或 者 说 某 事 有 一 半 
的 概率 发 生 ; 概率 为 1 则 相当 于 100%, 这 意味 着 它 必然 发 生 . 其 次 , 我 们 可 以 使 用 
概率 函数 来 找 出 其 他 事件 的 概率 , 比如 得 到 一 个 梅花 或 红 桃 的 概率 . 这 20 个 对 象 
中 的 15 个 是 梅花 或 者 红 桃 , 并 且 任 何 对 象 都 不 可 能 既是 梅花 又 是 红 桃 , 所 以 
Pr( 和 或 9) = 元 = Pr( 和 上 上 Pr) 
实际 上 , 最 后 两 个 性 质 是 我 们 希望 概率 函数 能 够 服从 的 一 般 特 性 . 更 具体 地 说 ， 
我 们 希望 概率 函数 能 够 满足 下 面 的 愿望 列表 . 


1 


站 
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愿望 列表 


(2) 如 果 {4;} 是 一 族 两 下 
是 空 集 ), 那么 Pr(UiA4i;) = 5j; Pr(4;). 


(GD 对 于 任意 的 事件 4 均 有 0 < Pr(4) < 1 
Pr(0)=1. 


如 果 9Q 是 结果 空间 , 那么 


互 不 相交 的 集合 (也 就 是 说 , 当 了 和 天 时 4jn 4 


第 一 个 条 件 说 明了 任何 事件 发 生 的 概率 都 不 可 能 大 于 1 或 小 于 0, 而 且 必 定 
有 某 事 发 生 . 第 二 个 条 伯 


关 . 为 了 保留 这 个 属性 , 在 分 本 
在 本 节 的 剩余 部 分 中 , 我 们 


是 一 族 两 两 互 不 相交 的 集合 , 那么 其 中 之 一 发 生 的 概率 就 是 它们 各 自 概率 的 总 和 | 
在 老虎 机 的 例子 中 , 当 我 们 考虑 得 到 一 个 梅花 或 红 愉 
但 实际 上 , 这 个 条 件 在 一 般 情况 下 并 不 能 满足 . 意料 之 


F 表 明了 在 茶 些 情况 下 概率 是 可 加 


的 ; 也 就 是 说 , 如 果 {A;} 


的 概率 时 , 上 述 结果 是 适用 的 ; 
FP 的 是 , 该 问题 与 无 穷 大 有 


事件 的 


会 介绍 


际 率 时 要 更 加 小 心 , 这 一 点 将 在 下 节 中 讨论 . 
E 间 和 概率 函数 . 


我 们 来 探讨 一 下 这 两 个 条 们 
实 如 此 , 否则 什么 都 没 发 生 的 概率 就 是 一 个 1 


出 什么 结果 . 我 们 将 证 明 Prob(g) = 0; 确 
E 数 ! 由 第 一 个 条 件 可 知 Prop(Q) = 


1.，Q 可 以 被 看 作 9 与 G 的 不 相交 的 并 ， 尽管 这 看 起 来 好 像 有 点 奇怪 , 但 是 Q 


和 CC 是 不 可 外 


EE 有 公共 元 素 的 ， 


因为 空 集中 没有 任何 元 素 ! 
2) = Prob(Q0) + Prob(C),， 也 就 是 1 = 1 十 Prob(@), 这样 就 得 到 了 


知 , Prob(Q U 
Prob(C) = 0. 

考虑 下 面 的 例子 .连续 两 
朝 上 出 现 了 几 次 .样本 空间 是 
可 能 是 0 
到 抛掷 硬币 一 共有 4 种 可 能 


反面 ， 因 为 硬 
面 的 结果 只 有 一 种 


Prob(1 次 正面 


次 抛掷 一 枚 均匀 的 硬币 ,我 们 要 考察 的 是 硬币 正 


于 是 , 由 第 二 条 性 质 可 


E 面 -反面 ,反面 -正面 和 反面 - 


币 是 均匀 的 , 所 以 每 种 结果 


性 都 相等 ， 由 于 出 现 两 次 正 
因此 Prob(2 次 正面 ) = 1/4， 按 照 同 样 的 逻辑 , 我 们 得 到 了 


) = 1/2 和 Prob( 没 出 现 正面 ) = 1/4. 回顾 一 下 , 在 考察 正面 出 现 几 
次 的 过 程 中 , 我 们 得 到 了 


Ee 
| 


Pr(0) = 


现在 稍微 调整 一 下 这 个 例子 . 假设 我 们 投掷 的 是 一 枚 不 均匀 的 硬币 , 它 正面 朝 


上 的 概率 是 0.7， 同 检 


整 后 的 例子 , 相 
或 2, 所 以 样本 空间 还 是 {0,1,2}. 六 


F, 我 们 考察 连续 抛 撕 硬 币 两 次 , 正面 朝 上 出 现 的 次 数 . 对 于 调 
本 空间 和 概率 函数 是 什么 ? 因为 正面 


朝 上 的 次 数 仍 然 只 可 能 是 0、1 
然 我 们 考察 的 是 不 同 的 问题 , 但 样本 空 
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间 没 有 发 生 任何 改变 . 因此 , 概率 函数 一 定 会 有 差异 . 但 是 , 怎样 求 正面 朝 上 出 现 了 
两 次 的 概率 ? 因为 硬币 是 不 均匀 的 , 所 以 我 们 不 能 简单 地 列举 所 有 可 能 的 结果 , 并 
像 之 前 那样 计算 比值 . 

解决 这 类 问题 的 一 种 方法 是 使 用 概率 树 , 这 是 让 可 能 结果 及 其 相对 频率 更 加 形 
象 化 的 一 种 好 方法 . 假设 我 们 要 把 这 个 抛 括 硬币 的 实验 重复 进行 1000 次 . 因为 硬 
币 正 面 朝 上 的 概率 是 0.7, 所 以 我 们 希望 在 这 1000 次 实验 中 , 第 一 次 抛掷 出 正面 的 
实验 共有 700 次 , 而 第 一 次 抛 据 出 反面 的 实验 共有 300 次 . 我 们 在 图 2-3 中 展现 这 


《AN 


70 儿 的 概率 正面 朝 上 


30 允 的 概率 反面 朝 上 


图 2-3 ” 抛 抑 1000 枚 硬币 的 预期 结果 , 其 中 每 一 枚 硬币 正面 朝 上 的 概率 都 是 70%， 
反面 朝 上 的 概率 都 是 30% 


硬币 的 第 二 次 抛掷 会 出 现 什 么 结果 ? 在 第 一 次 抛 出 正面 的 700 次 实验 中 , 我 
们 预计 其 中 有 70% 会 在 第 二 次 执 括 时 正面 彰 上 , 也 就 是 说 一 共有 490 次 实验 以 正 
面 -正面 结束 . 类 似 地 , 我 们 可 以 在 图 2-4 中 填充 树 的 下 一 个 分 支 . 
记 住 , 我 们 正 试图 找 出 与 集合 Q = {0,1,2} 相 匹 配 的 概率 函数 , 这 个 集合 描述 
的 是 在 连续 两 次 抛掷 一 枚 硬币 后 出 现 正面 朝 上 的 次 数 . 从 图 2-4 的 树 中 可 以 看 出 ， 
在 这 1000 次 实验 中 , 我 们 期 望 得 到 两 次 正面 的 实验 共有 490 次 , 出 现 一 次 正面 的 实 
验 共有 420 次 (其 中 出 现 正 面 -反面 的 实验 有 210 次 , 出 现 反 面 -正面 的 实验 有 210 
次 ), 没 出 现 正面 的 实验 共有 90 次 . 因此 , 概率 函数 为 

Pr(0) = 0.09， Pr(1) = 0.42, Pr(2) = 0.49. 

上 一 个 例子 使 用 的 方法 是 一 种 常见 技巧 : 先 通过 大 量 试验 计算 出 预期 结果 , 然 
后 再 进一步 划分 , 这 通常 是 一 种 很 好 的 策略 . 你 可 能 也 注意 到 了 , 连续 抛 出 两 个 正 
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面 的 概率 等 于 每 次 抛 出 正面 的 概率 的 乘积 . 这 并 非 巧合 . 我 们 经 常 使 用 乘法 法 则 来 
求 概率 , 它 指出 : 对 于 特定 的 4 和 B, 有 
Pr(ANMB)= Pr(A).: Pr(B) 


70% 


900 反面 -反面 | | 210 反而 -正面 | [210 正 南 -反而 [ 490 正面 -正面 


图 2-4 ” 抛 撕 1000 枚 硬币 的 预期 结果 , 其 中 每 一 枚 硬币 正面 朝 上 的 概率 都 是 70%， 
反面 朝 上 的 概率 都 是 30%; 每 枚 硬币 都 被 抛掷 两 次 


因此 , 在 这 个 例子 中 , 我 们 有 Prob( 两 次 正面 )=Prob( 正 面 ) = 0.49, 这 正 是 我 们 想 
求 的 . 在 一 般 情 况 下 , 这 个 公式 并 不 成 立 . 具有 当 4 和 B 相互 独立 时 它 才 成 立 . 我 
门将 在 第 4 章 中 给 出 独立 性 的 严格 定义 和 详细 讨论 . 就 目前 而 言 , 我 们 只 做 非 正 式 
地 讨论 . 如 果 事件 4 和 不 以 任何 方式 相互 影响 , 那么 就 说 它们 是 相互 独立 的 . 这 
意味 着 , 知道 其 中 一 件 事 发 生 (或 不 发 生 ) 不 会 影响 我 们 对 另 一 件 事 发 生 可 能 性 的 
了 解 . 在 抛掷 硬币 的 例子 中 , 我 们 可 以 合理 地 假设 一 次 掷 硬币 的 结果 不 会 影响 另 
次 掷 硬 币 的 结果 . 因此 , 在 这 里 使 用 乘法 法 则 是 合理 的 . 据 此 , 我 们 可 以 得 到 , 抛 出 
两 次 正面 的 概率 是 0.7 .0.7 = 0.49, 没有 出 现 正面 的 概率 是 0.3 .0.3 = 0.09, 抛 出 一 
次 正面 的 概率 是 2.0.7.0.3 = 0.42. (为 什么 有 个 因子 2? 因为 我 们 可 能 抛 出 正面 - 反 
面 , 也 可 能 抛 出 反面 -正面 . ) 注意 , 这 些 结果 与 我 们 用 树 形 法 求 出 的 概率 完全 相同 . 

注 2.3.1 在 创建 两 次 抛掷 硬币 的 概率 树 时, 我 们 考察 了 1000 枚 硬币 . 为 什么 
要 选择 1000? 这 主要 取决 于 问题 中 的 数 , 我 们 所 选取 的 硬币 数量 要 使 得 树 中 所 有 元 
素 都 是 整数 . 选择 其 他 数 是 没什么 问题 的 , 但 这 可 能 会 造成 硬币 的 数量 是 分 数 . 当 
然 , 我 们 不 需要 1000 个 , 100 个 硬币 就 足够 了 , 这 能 保证 树 上 的 数 都 是 整数 . 我 选 
择 1000 是 为 了 给 自己 一 些 保护 . 我 喜欢 这 样 做 , 以 防 在 计算 中 发 生 小 错误 . 我 给 自 
己 设置 了 一 个 小 的 安全 保障 . 
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2.4 概率 公理 


现在 我 们 要 给 出 概率 函数 满足 的 基本 规则 . 因为 讨论 这 些 问题 往往 会 用 到 一 些 
高 等 分 析 学 的 知识 , 尤其 是 2.6 贡 的 c 代数 , 所 以 我 们 只 考察 一 些 重要 的 特殊 情况 . 


对 于 有 限 或 可 数 的 结果 空间 , 结论 都 相当 简单 . 我 们 将 陈述 公理 , 并 给 出 示例 和 相 


关 应 用 . 和 往常 一 样 , 请 记 住 , 当 无 穷 大 出 现时 , 你 的 直觉 和 经 验 可 能 会 误导 你 ! 

2.6 节 的 要 点 是 , 给 定 一 个 结果 空间 Q, 只 能 在 一 组 特殊 的 子 集 上 定义 概率 函 
数 . 我 们 把 这 组 特殊 的 子 集 记 作 六 , 也 就 是 所 谓 的 og 代数. 这 组 子 集 有 很 多 好 的 性 
质 : 如 果 4 和 B 都 属于 i, 那么 ANB 和 AUB 也 都 在 中 . 此 外 ,如果 QQ 是 
有 限 的 或 可 数 的 , 那么 每 一 个 可 能 的 子 集 都 能 被 选 作 允 . 只 有 当 Q 中 有 不 可 数 个 
元 素 时 , 我 们 才 必 须 小 心 . 不 可 数 是 比 可 数 更 大 的 无 穷 大 ; 有 可 数 个 整数 , 但 有 不 可 


数 个 实数 . 有 关 无 穷 大 的 更 多 信息 , 请 参阅 附录 C. 


马上 就 会 给 上 


幸运 的 是 , 如 


中 包含 了 足够 多 的 子 集 . 例如 , 如 果 9 是 区 间 [0,1], 那么 就 


含 了 区 间 的 任意 有 限 并 和 任意 有 限 交 . 如 果 概 率 函 数 满足 一 些 很 好 的 性 质 (我 们 


), 那么 我 们 就 把 三 元 组 (Q, 》,Prob) 称 为 概率 空间 . 利用 函数 Prob， 


我 们 把 概率 分 配给 沁 的 子 集 , 其 中 是 一 个 定义 了 函数 Prob 的 特殊 o 代数 . 


我 们 用 柯 尔 英 戈 洛 夫 的 概率 公理 来 结束 这 部 分 介绍 , 2.6 节 将 给 出 更 加 详细 、 


更 加 严格 的 讨论 . 
代数 忌 中 到 底 包含 了 什么 , 我 们 现在 有 点 模糊 (实际 上 , 是 非常 模糊 )， 关 于 这 一 
点 , 我 们 将 在 2.6 节 中 展开 讨论 . 现在 , 想 想 每 天 发 生 的 事情 , 比如 掷 般 子 的 结果 , 抛 


注 


在 这 里 , 我 们 只 需要 熟悉 这 个 公理 并 了 解 其 合理 性 即 可 . 对 于 o 


币 的 结果 , 或 者 在 棒球 赛 中 得 分 的 次 数 . 更 好 的 是 , 能 把 9 看 作 一 个 有 限 集 , > 


前 


i 是 9 的 所 有 子 鲁 


的 集合 . 于 是 , 如 果 8 中 有 个 元 素 , 那么 8 的 2” 个 子 集 就 构 


成 了 》. 


( 柯 尔 莫 戌 洛 夫 的 ) 概率 公理 : 9 是 一 个 结果 空间 , 》” 是 一 个 o 代数 . 如 果 概 率 
函数 满足 下 列 条 件 , 那么 (Q, ,Prob) 就 是 一 个 概率 空间 . 
。 如果 A e >,, 那么 Pr(4) 是 有 定义 的 , 并 且 0 < Pr(4) <1. 


e PI(C) =0 


且 Pr(O) = 1 


合 构 成 的 集 族 , 并 且 每 一 


。 设 {4;} 是 由 有 限 个 或 可 数 个 两 两 互 不 相交 
个 集合 都 是 2” 中 的 元 素 . 那么 Pr(Ui4i) = 


的 外 
2 Pr(Ai). 


在 探讨 据 此 能 得 出 什么 样 的 结果 之 前 , 我 们 先 简单 地 看 一 下 这 个 公理 . 第 一 条 
说 明了 我 们 可 以 对 o 代数 2 中 的 任何 事件 分 配 概 率 , 并 且 概 率 必须 在 0 和 1 之 
间 取 值 . 这 个 界限 


显然 是 合理 的 : 任何 事情 发 生 的 概率 都 不 可 能 小 于 0. 不 管 棒球 


OO © 
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了 多么 糟糕 , 球 队 都 不 可 能 得 负 分 . 此 外 , 不 管 体育 播音 员 说 什么 , 没 人 能 够 给 出 
110% (或 更 多 ! ) 的 定论 . 不 管 球 队 有 多 强大 , 赢 球 的 概率 都 不 可 能 超过 100%. 

第 二 条 公理 断言 , 任何 事情 都 没有 发 生 的 概率 是 0, 而 有 事 发 生 的 概率 是 1. 这 
两 种 说 法 都 经 得 起 考验 , 且 与 我 们 的 经 验 相符 . 其 实 , 我 们 不 需要 给 出 Pr(2) = 0. 
事实 证 明 , 这 个 结论 可 以 由 其 他 公理 推出 (但 把 它 放 在 公理 中 会 更 好 , 这 样 做 并 没 
什么 坏处 ). 

最 后 一 条 公理 最 有 意思 . 这 里 的 关键 词 是 有 限 和 可 数 . 注意 , 在 我 们 的 讨论 中 ， 
这 是 第 一 次 出 现 无 穷 大 . 我 们 稍 后 会 看 到 , 把 结论 限定 在 有 限 集 或 可 数 集 上 是 至 关 
重要 的 , 更 大 的 无 穷 大 将 导致 严重 的 问题 . 但 是 , 如 果 把 问题 限定 在 有 限 个 或 可 数 
个 集合 上 , 那么 概率 就 是 可 加 的 . 最 重要 的 一 种 情况 是 , 如 果 4 和 B 是 中 两 个 
互 不 相交 的 元 素 , 那么 Pr(4U B) = Pr(4)+ Pr(B). 换 句 话说 , 如 果 4 和 B 不 能 司 
时 发 生 , 那么 它们 中 有 一 个 发 生 的 概率 就 是 它们 各 自发 生 的 概率 之 和 . 

我 们 来 探讨 一 些 概率 空间 的 例子 , 然后 在 下 节 中 继续 讨论 这 些 空间 的 重要 性 
质 . 

概率 空间 中 最 好 的 、 也 是 最 重要 的 例子 之 一 是 : Q 是 一 个 有 限 集 , 记 作 Q = 
{w1;w2,… ,wnj}; 0 代数 是 这 个 有 限 集 9 的 所 有 子 集 的 集合 . 我 们 需要 对 Q 的 元 素 
配 概率 , 最 简单 的 方法 就 是 让 所 有 元 素 的 概率 都 相等 , 那么 对 于 任意 的 1 <k<n 
有 Prob(w;) = 1/n. 在 这 种 情况 下 , 如 果 4 是 9 的 任意 一 个 子 集 , 那么 Prob(4) 就 
是 #4/#Q, 其 中 #5 表示 5 中 元 素 的 个 数 . 这 通常 被 称 为 计数 模型 . 在 这 种 概率 
定义 下 , 所 有 公理 都 成 立 . 

例如 , 想象 掷 一 颗 均 勺 的 人 般 子 . 此 时 , 我 们 掷 出 的 结果 可 能 是 1、2、3、4、5 或 者 
6, 并 且 每 种 结果 出 现 的 概率 都 是 1/6. 设 4 = {1,3,5}, 那么 Prob(4) = 3/6 = 1/2. 
这 意味 着 我 们 有 50% 的 概率 搓 出 奇数 . 

沿 着 这 种 思路 , 我 们 再 看 男 一 个 例子 . 设 9 = {1,2,3,4,5,6} 是 括 一 颗 仍 子 的 

结果 空间 . 设 4 = {2,4,6}( 搓 出 偶数 的 可 能 结果 ), B = {3,5}( 掷 出奇 素数 的 可 能 
结果 ). 那么 Pr(4) = 3/6, 因为 在 6 个 可 能 的 结果 中 , 有 3 个 属于 4; Pr(B) = 2/6 
并 且 Pr(4U B) = 5/6， 注 意 Pr(4 U B) = Pr(4) + Pr(B)， 这 个 式 子 成 立 是 因 
为 4 和 B 是 不 相交 的 如 果 我 们 考察 C = {2,3,5}( 掷 出 素数 的 可 能 结果 ), 那么 
Pr(AUC)= 5/6@#Pr(A)+Pr(C). 
再 看 另 一 个 例子 , 我 们 考虑 连续 5 次 抛 搓 一 枚 均匀 硬币 的 结果 空间 . 因为 每 次 
抛 硬币 的 结果 要 么 是 正面 (H), 要 么 是 反面 (T), 并 且 这 两 种 情况 发 生 的 概率 都 是 
1/2, 又 因为 一 共 抛 搓 了 5 次 , 所 以 结果 空间 中 一 共有 32 种 可 能 的 组 合 . 看 看 下 面 
的 列表 , 想 想 我 们 是 如 何 把 它们 列 出 来 的 . 重要 的 是 不 能 遗漏 任何 结果 , 因此 我 们 
需要 一 个 很 好 的 方法 来 给 出 所 有 可 能 性 . 例如 , 每 当下 降 一 个 等 级 时 , 反面 的 总 数 
就 会 多 1. 另外 , 想 一 下 我 们 是 如 何 列 出 一 个 等 级 中 的 所 有 字符 串 的 . 


由 
i 


> 
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。 HHHHH, 


HHHHT, HHHTH, HHTHH, HTHHH, THHHH, 


。 HHHTT, HHTHT, HTHHT, THHHT, HHTTH, HTHTH, THHTH, HTTHH, 
THTHH, TTHHH, 


HTHTT, HHTTT, 
。 TTTTH, TTTHT, TTHTT, THTTT, HTTTT, 


。 TTTTT. 
用 4 表示 “4 


16/32 = 1/2. 


对 于 上 面 这 个 问题 , 有 一 种 


现 偶数 次 下 下 


TTTHH, TTHTH, THTTH, HTTTH, TTHHT, THTHT, HTTHT, THHTT, 


能 性 有 3 种 , 即 出 现 0、2 或 4 次 正面 ; 


1、3 或 5 次 正面 . 医 


此 , 出 现 


”这 一 事件 . Pr(4 
看 到 在 事件 列表 中 , 32 个 结果 中 共有 16 个 结果 出 现 了 偶数 次 正面 , 因此 Pr(4) 


普 误 的 方法 . 这 个 方法 指出 , 出 现 偶数 次 正面 的 可 


是 多 少 呢 ? 利用 计数 法 , 我 们 


— 


出 现 奇数 次 正 


1 的 可 能 性 也 有 3 种 , 即 出 现 


遇 数 次 正面 的 概率 是 3/6, 即 1/2. 虽然 这 个 答案 是 正 


确 的 , 但 这 只 是 个 巧合 . 问题 在 于 出 现 正 面 的 次 数 并 不 是 等 可 能 的 : 出 现 0 次 正面 


的 概率 是 1/32, 出 现 2 次 正面 


的 概率 是 10/32, 出 现 4 次 正面 的 概率 是 5/32. 每 个 


由 正面 和 反面 组 成 的 字符 串 的 概率 才 是 相等 的 , 正面 出 现 的 次 数 并 不 是 等 可 能 的 . 


要 想 解 决 上 面 


和 反面 并 没有 什么 区 别 , 
抛掷 了 5 次 , 所 以 要 
因此 , 出 现 
是 互 不 相交 的 事件 且 


时 出 现 . 


这 个 问题 , 还 可 以 采用 另 一 种 方法 , 那 就 是 对 称 法 . 人 硬币 的 正面 

正 反 面 互 换 之 后 , 我 们 并 没有 真正 改变 什么 . 由 于 我 们 一 
出 现 偶数 次 正面 , 要 么 出 现 偶 数 次 反 国 
昌 数 次 正面 的 概率 应 该 等 于 出 现 偶数 次 反面 的 概率 . 由 于 它们 


, 但 两 者 不 能 同 


| 惟有 其 一 发 生 , 因 


件 发 生 的 概率 都 是 1/2. 


面 和 出 现 偶数 次 反面 并 不 是 互补 事件 . 但 利用 问题 的 某 种 对 称 性 , 我 们 仍然 可 以 证 


明 概 率 是 1/2. 


现在 给 


上 面 的 讨论 适用 于 但 


F 何 奇数 次 的 抛 括 . 下 面 给 出 一 个 很 好 的 练习 : 如 果 我 们 一 
共 抛 掷 了 偶数 次 , 试 着 对 上 面 的 论述 做 出 相应 调整 . 现在 的 问题 是 , 出 现 偶数 次 正 


此 两 者 概率 之 和 一 定 为 1. 这 就 使 得 每 个 事 


出 一 些 关 了 
出 来 的 . 必须 强调 , 记 他 
概率 . 下 面 我 们 简单 地 陈述 一 些 比较 直观 的 事实 ， 
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概率 空间 的 基本 规则 
我 们 不 是 把 概率 分 配给 所 有 事件 , 而 是 只 对 特殊 集合 分 配 


条 公 


面 的 里 扒 


这 些 结论 是 由 前 


并 把 更 严格 的 论述 留 到 2.6 节 . 


给 出 一 个 概率 空间 (9Q,2,Prob), 其 中 是 由 Q 的 全 体 子 集 构成 的 集合 , Prob 


把 概率 分 配给 允 


P 的 每 一 个 元 素 . 特别 有 , Pr(G) = 0, Pr(O) =1, 并 且 当 4cQ 时 
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Pr(4) 是 有 定义 的 . 最 后 , > 中 有 限 个 或 者 可 数 个 两 两 
就 等 于 这 些 元 素 的 概率 之 和 . 下 面 的 四 条 怕 


互 不 相交 的 元 素 的 并 的 概率 


E 质 非常 有 用 , 值得 我 们 去 单独 记忆 . 


Pr(A)= 1— Pr(A°). 


如 , 如 果 有 三 个 事件 , 那么 


Pr(41 U 


A2U 


这 也 被 称 为 “ 容 斥 原理 ”. 


不 
其 中 B 


定 有 Pr(4) < Pr(B), 但 我 们 古 
Nn A° 指 的 是 B 中 不 
(4) 如 果 对 于 任意 的 i, 均 有 4; C B, 那么 Pr(Ui;Ai;) < Pr(B). 


概率 空间 的 有 用 规则 : 设 (9,2, Prob) 是 一 个 概率 空间 , 那么 可 以 得 到 如 下 结论 . 
(1) “全 概率 公式 ”: 如 果 4 e ,那么 Pr(4) + Pr(4°) = 1， 也 就 是 说 ， 


(2) Pr(4UB) = Pr(4) 上 +Pr(B) -Pr(4nB). 这 个 式 子 可 以 进 


43) =Pr(41) 十 Pr(42) 十 Pr(43) 
Pr(Ai NN A,) Pr(Ai NN 43) 
一 Pr(42 NN 43) 十 Pr(41 NM 42 门 A;3). 


(3) 如 果 4 c B, 那么 Pr(A) < Pr(B). 然而 , 如 果 4 是 B 的 真 


步 推广 . 例 


集 , 那么 


有 定 有 Pr(B) = Pr(A) + Pr(BN A®), 


属于 4 的 所 有 元 素 . 


注意 , 这 上 
式 的 一 个 特例 , 我 们 将 


[讨论 ， 


EE 的 “全 概率 公式 ” 带 有 引号 . 这 条 性 质 实际 上 是 更 一 般 的 全 概率 公 
E 4.5 节 中 展 玫 


在 接 下 来 的 几 个 小 节 中 , 我 们 将 证 明 上 述 性 质 并 给 出 示例 . 我 们 还 会 在 本 章 的 


末尾 介 引 


本 章 最 重要 的 部 分 ! 原 
杂 . 我 们 所 做 的 大 


人 


变 


2.5.1 


人 


合 , 并 且 


和 导 越 来 越 
答案 的 函数 形式 . 这 
更 容易 证 明 它 ! 


朱 一 


如 何 猜测 某 些 情况 下 的 答案 (2.7 节 ). 从 某 种 意义 上 说 , 这 部 分 内 容 可 以 
因为 它 只 是 一 种 非 严 格 地 猜测 答案 的 尝试 ; 然而 , 从 另 一 种 意义 上 来 说 , 它 是 


日 


因 是 , 随 


A 


全 概率 公式 


项 非常 实 


条 规则 可 以 直接 | 


概率 函数 的 怕 


因此 , 我 们 有 


着 学 习 的 不 断 深入 , 你 需要 处 理 的 公式 和 表达 式 会 
部 分 都 是 实验 性 的 数学 , 试图 在 证 明 答案 之 前 找 出 
用 的 技能 , 因 
因此 , 我 强烈 建议 你 认真 研读 那里 的 分 析 , 并 尝试 其 他 的 问题 . 


为 如 果 你 知道 想 要 证 明 什么 , 那 就 


FE 质 推导 出 来 4 和 4e 是 互 不 相交 的 集 


1 = Pr(O) = Pr(AU A‘) = Pr(A) + Pr(49)， 


最 后 一 个 等 号 成 立 的 原 


之 和 


因 是 , 两 个 互 不 相交 事件 的 并 的 概率 就 等 于 两 个 事件 的 概率 


全 概率 公式 在 概念 上 是 很 简单 的 : 4 发 生 


让 


的 概率 应 该 是 1 减 去 4 不 发 生 的 概 
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率 . 这 种 重新 表述 非常 有 用 , 因为 计算 某 件 导 
率 容易 很 多 . 
例如 , 假设 纽曼 和 克 雷 默 ( 源 自 喜剧 《 宋 飞 正 传 》) 正在 玩 一 场 激烈 的 冒险 游 
戏 . 克 雷 默 坚 信和 乌克兰 处 于 弱势 并 发 起 攻击 . 他 掷 了 3 颗 山 子 , 纽曼 扼 了 2 颗 盟 子 . 
如 果 你 以 前 从 未 玩 过 冒险 游戏 , 那么 这 个 游戏 的 关键 在 于 ， 颗 骨 子 都 是 均匀 的 ， 
并 有 旦 每 一 次 撕 骨 子 都 是 独立 的 且 撕 出 的 数字 越 大 越 好 . 我 们 想 知 道 能 括 出 多 少 个 6. 
于 是 , 我 们 试 着 计算 至 少 掷 出 一 个 6 的 概率 , 并 把 这 个 事件 记 作 4. 不 笠 的 是 , 能 导 
致 这 个 事件 发 生 的 可 能 情况 有 很 多 种 . 我 们 可 能 恰好 掷 出 一 个 6, 也 可 能 恰好 掷 出 
2 个 6.3 个 6.4 个 6 或 者 恰好 掷 出 5 个 6. 我 们 必须 计算 出 每 一 个 概率 , 但 这 很 快 
就 会 变 得 一 团 糟 . 幸运 的 是 , 4e 的 概率 很 容易 计算 , 4* 表示 我 们 没有 掷 出 6 的 事 
件 . 此 时 , 由 于 一 颗 仍 子 没 有 掷 出 6 的 概率 是 5/6, 所 以 5 颗 骨 子 都 没有 掷 出 6 的 
概率 就 是 (5/6)5. 于 是 , Pr(4) = 1 工 - Pr(4e) =1- (5)5 = 651 ~ 59.8%. 
当 我 们 抛 撕 5 颗 骨 子 时 , 对 于 每 个 可 能 的 值 , 计算 恰好 掷 出 天 个 6 的 概率 ， 
这 是 个 让 人 很 头疼 的 练习 . 做 这 个 练习 可 以 帮助 你 更 好 地 理解 全 概率 公式 . 书 中 没 
有 给 出 详细 说 明 , 因为 我 已 经 做 过 很 多 次 这 类 题目 了 , 而 且 对 互补 概率 的 方法 有 了 
深刻 的 认识 ! 
利用 某 件 事 不 发 生 的 概率 来 求 该 事件 发 生 的 概率 是 解决 问题 的 一 个 好 方法 . 我 
们 在 第 1 章 研 究 的 生日 问题 就 是 个 很 好 的 例子 . 把 至 少 两 个 人 的 生日 在 同一 天 的 
所 有 可 能 情况 都 记录 下 来 对 我 们 来 说 就 是 一 场 晋 梦 , 但 研究 所 有 人 生日 都 不 在 同一 
天 的 情况 就 非常 简单 了 . 
2.5.2 ”并 的 概率 
为 了 证 明 第 二 条 规则 , 我 们 可 以 利用 这 样 一 个 事实 : 如 果 存 在 有 限 多 个 两 两 互 
不 相交 的 集合 0;, 那么 这 些 集合 的 并 的 概率 就 等 于 它们 各 自 概 率 的 和 (第 三 条 概率 
公理 ). 我 们 把 AU B 写成 
AUB=(A\(A4ANB)U(B\(A4NB)U(ANB), (2.1) 
其 中 A\ (ANB) 是 由 4 中 全 体 不 属于 B 的 对 和 象 构成 的 . 像 上 面 那样 , 把 集合 AUB 
分 解 成 属于 4 但 不 属于 B 的 对 象 , 属于 B 但 不 属于 4 的 对 象 , 以 及 既 属 于 4 又 
属于 B 的 对 象 , 会 对 我 们 很 有 帮助 . 在 这 个 过 程 中 , 我 们 没有 重复 计算 , 并 考虑 了 
所 有 可 能 的 情况 . 也 就 是 说 , 利用 集合 论 的 符号 就 能 彻底 解决 这 个 问题 . 但 我 们 很 
容易 在 查看 符号 的 过 程 中 迷失 . 让 我 们 回 过 头 来 重新 调整 一 下 , 从 另 一 个 角度 来 看 
问题 . 我 们 要 证 明 的 是 
Pr(AUB)= Pr(A)+Pr(B)— Pr(ANMB). 
现在 对 等 式 左右 两 端的 表达 式 分 别 进行 前 释 , 并 证 明 它 们 描述 的 是 同一 件 事 . 
等 式 左 端 是 AUB 的 概率 . 换 句 话说 , 它 是 z 属于 4 或 者 z 属于 巨 或 者 z 既 
属于 4 又 属于 B 的 概率 . 但 我 们 应 该 如 何 解释 右 端 的 表达 式 呢 ? 首先 , Pr(4) 和 


= 
ea 
涉 

站 


之 生 的 概率 往往 比 计算 它 发 生 的 概 


HR 


ae 
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Pr(B) 分 别 表 示 z 属于 4 和 zx 属于 B 的 概率 . 最 初 , 我 们 可 能 认为 这 两 个 概率 之 


和 是 z 属于 其 中 之 一 的 概率 , 但 这 种 观点 是 不 正确 的 , 因为 它 忽 略 了 重复 计数 所 产 
生 的 问题 . 如 果 x 同时 属于 4 和 B, 那么 我 们 就 把 它 计 算 了 两 次 一 一 一 次 是 将 zx 


作为 4 中 的 元 素 , 另 一 次 是 将 x 作为 B 中 的 元 素 . 因 


的 概率 . 这 样 就 得 出 了 结论 . 


我 们 给 出 这 个 结果 的 第 二 种 论证 有 两 个 原 
果 , 所 以 我 们 想到 可 以 考虑 采取 多 种 途径 来 实现 它 . 其 次 , 这 种 论证 引入 了 一 个 有 


用 的 概念 . 我 们 还 可 以 利用 文 氏 图 来 以 图 形 化 的 方式 演示 第 


述 结果 空间 9 的 一 种 方式 . 我们 用 一 个 矩形 来 表示 9, 然后 用 阴影 或 标记 来 表示 
9 的 子 集 . 设 4 和 B 是 9 的 两 个 互 不 相交 的 真子 集 . 这 检 


如 图 2-5 所 示 . 


图 2-5 


我 们 看 到 区 域 A4U B 可 以 分 解 成 三 个 互 不 


集合 4 与 B 的 文 氏 图 


林口 


0 


因 . 首先 , 因为 这 是 个 非常 重要 的 结 


fF 我 们 就 可 以 夯 出 文 氏 图 


此 , 必须 减 去 x 属于 ANnB 


二 条 规则 . 文 氏 图 是 描 


相交 的 区 域 的 并 . 把 C1 称 为 4 中 


不 与 B 共享 的 部 分 , 那么 C1 = 4mn B°( 即 所 有 属于 4 但 不 属于 B 的 点 的 集合 ). 注 


意 , 4n Be 和 A\ (4NnB) 表示 的 是 同一 个 


区 域 , 但 第 一 个 符号 更 加 紧凑 . 同样 地 ， 


让 C2 表示 B 中 不 与 4 共享 的 部 分 , 所 以 Cs = BN 4°. 最 后 ,把 C3 设 为 4 和 B 


的 公共 部 分 , 于 是 Cs = 4 B. 这 相 


表达 的 意思 . 如 前 所 述 , 不 相交 集合 的 可 数 并 的 概率 就 是 它 人 


我 们 有 


就 有 AUB= Oi1UC2U 


Cs. 这 正 是 式 (2.1) 所 
] 各 自 概率 的 和 . 于 是 ， 


但 我 们 可 以 改写 这 个 式 子 . 注意 C 


B 的 点 的 集合 , 而 Cs 是 同时 属于 4 和 B 的 点 的 集合 . 因 


地 , CUCs3=B C3 二 ANB. 因 
Pr(AUB) 


UCs== 4. 为 什么 ? C 是 所 有 属于 4 但 不 属于 
此 它们 的 并 就 是 4. 类 似 


此 , 我 们 得 到 


一 Pr(O1) 十 Pr(Co) 十 Pr(C3) 


| 


Pr(4) 十 Pr(B 


)— Pr(ANB). 


(Pr(C1) + Pr(C3)) + (Pr(C2) + Pr(C3)) — Pr(C3) 
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在 上 面 的 代数 运算 中 , 我 们 有 一 些 聪 明 的 做 法 , 那 就 是 “什么 都 不 做 ”! 在 数学 
中 , 什么 都 不 做 是 最 重要 的 技能 之 一 .“ 什 么 都 不 做 ”的 方式 有 两 种 : 加 上 0, 或 者 
乘 以 1. 这 些 都 是 非常 有 用 的 证 明 技巧 . 通过 添加 Pr(C3) - Pr(Cs), 我 们 在 原来 的 
式 子 中 加 上 了 0, 因为 这 能 使 我 们 得 到 Pr(4) 和 Pr(B) 这 两 项 . 熟练 把 握 这 种 论证 
方法 需要 大 量 的 实践 ; 有 关 这 种 技巧 的 更 多 信息 , 请 参阅 A.12 节 . 我 可 以 给 出 的 最 
好 建议 是 , 想 想 你 有 什么 , 想 要 得 到 什么 , 以 及 怎样 做 才能 有 助 于 你 实现 目标 . 
我 们 用 一 个 例子 来 演示 第 二 种 方法 (参见 图 2-6). 


{2, 4, 8, 10, 14, 16, 20} 


{1, 5, 7, 11, 13, 17, 19} 


图 2-6 A = {2,4,6,..- ,20}, B = {3,6,9, ,18} HQ= {1,2,3,... ,20} 的 文 氏 图 


设 9 = {1,2,… ,20}, 并 且 每 个 元 素 的 概率 均 为 1/20. 此 时 , 如 果 C 是 9 的 
任意 子 集 , 那么 有 Pr(C) = #C/20. 设 4 Cc Q 是 所 有 能 被 2 整除 的 数 的 集合 , B 是 
所 有 能 被 3 整除 的 数 的 集合 . 那么 

A = {2,46……,20}，Pr(4) = 10/20 
B =1{3,6,9,... ,18}, Pr(B) = 6/20 
ANMB = {6,12,18}, Pr(ANB) = 3/20 
AUB = {2,3,4,6,8,9,10,12,14,15,16,18,20}, Pr(AUB) = 13/20. 


注意 , 13/20 = 10/20 + 6/20 一 3/20. 

公式 Pr(A4UB) = Pr(4) ++Pr(B) 一 Pr(4NnB) 的 优点 是 , 右 端 三 个 概率 计算 起 
来 要 比 左 端的 概率 容易 得 多 . 从 表面 上 看 , 这 个 说 法 似乎 很 癌 廖 . 当 我 们 只 需要 解 
决 一 个 问题 时 , 为 什么 求解 三 个 问题 会 更 好 ? 当然, 答案 取决 于 这 一 问题 在 本 质 上 
与 其 他 三 个 问题 的 相关 性 . 假设 我 们 把 9 替换 成 {1,2,… ,1010}. 我 们 可 以 轻松 地 
写 出 右 端 的 三 个 概率 , 但 必须 利用 枚 举 法 才能 求 出 左 端 的 概率 , 即 Pr(A4U B). 利用 
这 个 公式 , 由 原来 的 集合 以 及 它们 交集 可 以 得 到 集合 的 并 . 在 很 多 问题 中 , 交集 要 
比 并 集 更 好 求 ! 这 是 我 们 观察 到 的 一 个 重要 结果 . 在 本 书 中 , 我 们 会 多 次 用 到 它 . 

并 集 公式 非常 重要 , 值得 我 们 花 更 多 的 时 间 去 思考 . 有 时 候 , 大 声 朗 读数 学 公 
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式 可 以 为 我 们 提供 答案 的 线索 .鉴于 我 们 倾 问 于 命名 任何 可 以 被 认为 是 技巧 的 东 


西 , 因此 我 们 称 之 为 大 声 说 出 来 的 技巧 . 例如 , 考虑 sin(arcsin(z)). 换 句 话说, 这 是 


求 正弦 为 z 的 角 的 正弦 . 这 显然 就 是 z! 如 果 我 们 想 求 Pr(4 U B), 那 就 是 求 或 者 


属于 4, 或 者 属于 B, 或 者 既 属 于 4 


又 


可 以 看 到 要 求 的 就 是 三 个 概率 : Pr(4), Pr(B) 和 Pr(4mn B). 


我 们 再 举 


学 . 最 初 , 每 个 人 都 坐 在 某 位 置 上 . 假设 Valeri 坐 在 第 一 个 座位 上 ,Charlotte 坐 在 
第 二 个 座位 上 . 接 下 来 所 有 人 都 离开 教室 , 然后 返 世 
. 那么 Valeri 或 Charlotte 坐 在 原来 座位 上 的 概率 是 多 少 ? 

设 事件 4 是 Valeri 坐 回 原来 的 座位 , 设 事件 B 为 Charlotte 坐 蕊 
位 . 我 们 想 求 的 是 Pr(AUB). 这 直接 计算 起 来 并 不 容易 , 因 


位 置 上 


个 例子 来 说 明 求 交集 要 比 求 3 


集 容易 得 多 . 假设 班 上 共有 


属于 B 的 元 素 的 概率 . 像 这 样 写 出 来 , 我 们 


27 个 同 


, 每 个 人 都 等 可 能 地 坐 在 任何 


一 个 人 坐 回 原 来 座位 的 所 有 可 能 情况 , 但 


因为 一 共有 27 个 人 , 所 以 把 他 们 安 


中 一 mn 一 JTJ -2)3.2.1 因此 3!=6 
一 个 返回 教室 的 人 有 
教室 的 人 有 26 种 可 能 的 选择 , 依 此 类 推 . 
25.…3.2.1)/27! = 1/27. 这 是 因为 Valeri( 或 Charlotte) 必须 回 到 
的 选择 ), 而 其 余 的 26 个 人 可 以 坐 在 任何 位 置 上 . 


于 是 , 我 们 使 用 乘法 原理 . 


(只 有 唯 


排 在 27 个 座位 上 的 方法 一 


原 
为 我 们 需要 找到 至 少 有 
是 Pr(4), Pr(B) 和 Pr(4mB) 并 不 难 找 
有 27! 种 ( 记 住 
41 = 24; 还 要 注意 (n 十 1) = (n 十 1)nl). 
27 种 可 能 的 选择 , 第 二 个 返回 


由 此 可 以 推出 Pr(4) = Pr(B) = (1 26. 
| 她 原来 的 座位 上 


Pr(4n B) 是 多 少 呢 ? 它 就 等 于 (1.1.25.24.…3.2.1)/27! = 1/(27.26). 在 这 


头 的 两 个 1 是 | 
哪里 很 关键 ). 把 


于 Valeri 和 Charlotte 都 必须 入 
上 面 这 些 结果 结合 起 来 就 得 到 了 


在 特定 的 座位 上 (她 们 坐 在 


1 1 17 


Pr(AUB)= 


为 存在 重复 计算 的 可 能 性 , 所 以 
在 上 面 的 讨论 中 , 我 们 必须 非常 


1 
27 
直 约 等 于 7.26%, 与 2/27( 约 等 于 7.41%) 十 分 接近 


27 27.26 234° 


这 个 值 要 比 4 和 B 的 概率 之 和 略 小 . 


谨慎 地 回答 正 硼 


的 问题 . 通过 观察 不 难 


进入 房间 的 人 选择 坐 在 哪里 将 会 影响 下 


因此 , 概率 几乎 是 可 加 的 ， 


发 现 , 先 


个 人 的 选择 . 这 就 是 条 件 概率 ; 拿 本 题 来 


说 , 某 个 人 能 和 否 坐 在 一 个 特定 的 座位 上 取决 于 其 他 人 如 何 选择 . 我 们 将 在 第 4 章 讨 


论 条 件 概率 . 


我 们 将 来 还 会 再 看 到 这 个 问题 . 更 一 般 的 情形 是 , 可 以 求解 如 果 随 机 地 重组 n 


个 对 象 , 那么 至 少 有 一 个 对 象 回 


会 收敛 到 (e - 1)/e. 
2.5.3 ”包含 的 概率 


第 三 条 规则 的 证 明 更 加 简单 明了 . 


设 集合 4 


是 集合 B 的 子 集 . 关于 


到 它 原 来 位 置 的 概率 是 多 少 . 随 着 ”的 增长 , 答案 


A 和 B 


的 概率 , 我 们 都 知道 些 什 么 ? 从 直观 上 看 , B 发 生 的 概率 应 该 至 少 与 4 发 4 


E 的 概率 
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相同 , 因为 上 只 要 4 发 生 , B 一 定 会 发 生 . 但 是 , 如 何 把 它 形式 化 ? 因为 4 是 B 的 子 
集 , 所 以 


B= AU(BNMA®). 
这 里 的 BN 4° 是 所 有 属于 B 但 不 属于 4 的 元 素 的 集合 . 我 们 刚 说 过 B 可 以 分 解 
成 两 个 互 不 相交 的 子 集 : 4 以 及 所 有 属于 B 但 不 属于 4 的 元 素 的 集合 . 由 于 4 和 
BN 4e 是 不 相交 的 , 因此 由 Pr(Bn A°) > 0 可 得 
Pr(B) = Pr(4) 二 PrBn42) > Pr(A) 
我 们 回 到 括 山 子 的 问题 . 假设 我 们 重新 掷 这 5 颗 骨 子 . 令 事 件 B 表示 所 有 骨 
子 掷 出 的 点 数 都 是 奇数 , 设 事 件 4 为 所 有 人骨 子 掷 出 的 点 数 均 为 1. 显然 , 如 果 4 发 
生 , 那么 B 一 定 发 生 ; 事件 4 是 事件 B 的 一 个 真子 集 . 4 的 概率 是 (1/6)5, 而 B 
的 概率 是 (3/6)5. 因此 , Pr(4) < Pr(B) 一 一 实际 上 , 此 时 我 们 有 Pr(4) < Pr(B). 
既然 我 们 知道 了 第 三 条 规则 , 那么 马上 就 能 得 出 第 四 条 : 我 们 要 做 的 就 是 令 
4=Uzi4i. 由 4; CB 可 知 , U14i; C B; 接 下 来 再 利用 第 三 条 规则 就 行 了 . 
这 就 引出 了 一 个 一 般 原 则 : 对 于 给 定 的 并 集 , 我 们 通常 希望 能 把 它 写 成 几 个 
互 不 相交 的 集合 的 并 . 概率 中 最 常见 的 错误 之 一 是 重复 计数 . 举 个 例子 , 我 们 考 
抛 一 枚 均匀 硬币 100 次 后 出 现 连 续 正面 的 次 数 . 如 果 让 A; 表示 在 100 次 抛掷 
至 少 出 现 i 次 连续 正面 这 个 事件 , 那么 这 些 集合 显然 不 是 互 不 相交 的 (如 果 出 现 了 
6 次 连续 的 正面 , 那么 也 就 有 5 次 连续 的 正面 ). 对 于 某 些 问 题 , 换个 角度 去 考察 是 
有 意义 的 , 比如 令 B; 表示 在 100 次 抛掷 中 , 最 多 连续 出 现 次 正面 的 事件 . 注意 
Bi 之 间 是 互 不 相交 的 . 


-中 
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在 上 一 节 中 , 我 们 列 出 了 概率 公理 . 但 在 此 过 程 中 , 我 们 忽略 了 一 些 技术 上 的 
细 贡 .本 节 中 的 例子 会 涉及 一 个 我 们 需要 了 解 的 陷阱 . 我 们 会 看 到 o 代数 是 如 何 
对 概率 进行 严格 处 理 的 . 

我 们 在 本 章 开头 阐述 的 罗素 悖 论 对 研究 集合 有 着 深远 的 影响 . 现在 我 们 来 看 另 

个 可 以 直接 应 用 于 概率 的 悖 论 . 本 节 会 涉及 高 等 内 容 , 并 且 通 常会 在 入 门 课 中 被 
忽略 掉 . 只 略 读 一 下 这 部 分 内 容 来 感受 其 挑战 性 就 很 好 了 . 

巴 拿 赫 - 塔 尔 斯 基 悖 论 在 应 用 于 概率 时 产生 了 重大 影响 . 下 面 的 说 法 似乎 是 合 
里 的 : 当 我 们 旋转 或 平移 一 个 三 维 物体 时 , 它 的 体积 不 会 发 生 改变 . 换 句 话说, 旋转 
和 移动 不 对 体积 产生 任何 影响 . 考虑 一 个 实心 的 单位 球 ， 巴 拿 赫 - 塔 尔 斯 基 悖 论 告 
诉 我 们 , 球体 可 以 分 成 5 个 互 不 相交 的 部 分 ; 我 们 可 以 通过 简单 地 平移 和 旋转 , 把 
其 中 3 个 部 分 组 装 成 一 个 实心 单位 球 , 把 其 余 2 个 部 分 组 闭 成 另 一 个 实心 单位 球 . 
尽管 平移 和 旋转 不 应 该 改变 体积 , 我 们 却 使 球 的 体积 增加 了 一 倍 ! 这 种 结构 完全 取 


N= 
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决 于 (不 可 数 的 ) 选择 公理 , 即 任意 给 定 一 组 集合 (4z)zey, 其 中 指标 集 为 7, 存在 
一 个 从 了 到 A; 的 并 的 函数 f, 使 得 对 于 任意 的 xz 均 有 f(x) e 4 解释 一 下 , 这 意 
味 着 通过 从 每 个 4。 中 选择 一 个 元 素 a;, 我 们 可 以 构造 一 个 新 的 集合 . 这 里 的 选择 
函数 就 是 f. 对 于 可 数 个 集合 , 这 是 合理 的 : 可 数 集 与 N 具有 一 一 对 应 的 关系 . 通 
过 “遍历 ”指标 集 , 我 们 很 清楚 何 时 到 达 要 挑选 代表 元 的 集合 . 但 是 , 对 于 不 可 数 个 
集合 的 情况 , 我 们 不 知道 “什么 时 候 ” 能 找到 需要 挑选 代表 元 的 特定 集合 . 

从 概率 角度 来 说 , 这 一 切 都 意味 着 什么 ? 这 意味 着 , 如 果 我 们 假设 并 接受 这 个 
在 许多 数学 分 支 中 都 很 有 用 的 选择 公理 , 那么 “体积 ”的 概念 就 不 是 我 们 预想 的 那 
样 了 . 因为 我 们 会 经 常 使 用 体积 来 定义 概率 , 所 以 困难 是 显而易见 的 . 这 类 问题 有 
几 种 可 能 的 解决 方案 . 一 个 常见 的 解决 方案 是 只 对 特定 集合 分 配 概率 . 但 是 要 对 什 
么 样 的 集合 分 配 概率 呢 ? 能 使 球 的 体积 翻 倍 的 五 分 法 是 很 难 构造 出 来 的 . 我 们 甚至 
无 法 描述 它 , 只 能 通过 选择 公理 来 表 定 其 存在 性 . 或 者 说 , 如 果 考 虑 那些 “好 的 ” 集 
合 , 那么 体积 的 性 质 就 会 很 好 . 在 高 等 课程 中 , 利用 o 代数 及 其 度量 的 知识 可 以 实 
现 这 一 点 , 现在 简单 介绍 一 下 . 

我 们 已 经 看 到 , 试图 按照 统一 的 方式 为 所 有 可 能 发 生 的 事件 分 配 概 率 是 有 问 
题 的 . 我 们 回 过 头 来 看 看 上 一 节 简 要 讨论 过 的 一 个 场景 , 用 于 说 明 一 不 小 心 就 会 出 
背 . 随机 地 向 单位 圆 投掷 一 个 飞镖 , 我 们 可 以 合理 地 假设 飞镖 落 在 任何 一 点 的 概率 
都 是 相等 的 . 我 们 把 这 个 概率 记 作 c. 于 是 就 得 到 了 下 列 情况 . 

。 结果 空间 为 0 = {(zx,9) :22 二 六 二 1}. 

。 设 Azy 为 飞镖 落 在 点 (zx,y) 这 一 事件 . 根据 上 面 所 说 的 , 如 果 z2 十 妇科 1， 
那么 Pr(4。y) = ci; 否则 , Pr(4。y) = 0. 

c 应 该 是 多 少 呢 ? 事实 证 明 , c 取 任 何 值 都 不 对 . 在 这 里 , 结果 空间 可 以 分 解 成 
如 下 不 相交 的 并 : 

= 人 hy 


这 
22+y2<1 


于 是 
1=PrO)= > PrAsw)= > < 
2+ 史 sa 22+ 江 < 


如 果 ec > 0, 那么 遍历 x,y 后 的 总 和 就 是 无 穷 大 ; 如 果 c= 0, 那么 总 和 就 是 0. 在 任 
何 一 种 情况 下 , 我 们 都 没有 得 到 1. 因此 , 我 们 无 法 分 配 概率 , 这 就 说 明了 2.4 节 中 
讨论 的 概率 函数 的 性 质 是 成 立 的 . 

哪里 出 问题 了 呢 ? 问题 在 于 我 们 如 何 定义 事件 . 如 果 只 存在 有 限 个 可 能 性 , 那 
么 我 们 的 定义 是 可 行 的 ; 但 正如 刚才 所 述 , 当 有 无 穷 多 个 事件 时 , 它 就 会 失效 . 为 了 
解决 这 个 问题 , 我 们 必须 更 加 谨慎 地 考虑 什么 才能 被 看 作 事件 . 技术 层面 上 的 解决 
方案 涉及 研究 集合 的 a 代数 . 最 后 , 我 们 来 严格 地 定义 它 ! 9 的 一 个 o 代数 忆 指 
的 是 满足 下 列 性 质 的 8 的 子 集 所 构成 的 一 个 非 空 集合 . 
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设 0 是 一 个 集合 , 允 是 由 9 的 子 集 构成 的 一 个 非 空 集合 . 那么 在 如 下 前 提 下 , 允 
是 一 个 o 代数 . 
(1) 如 果 4ez2, 那么 有 4ec e 2. 
(2) 习 的 子 集 的 可 数 并 仍 属于 2: 如 果 每 一 个 4; 均 满 足 A; e ,那么 
U?2 A;€ 二 ， 


这 意味 着 我 们 可 以 对 c 代数 里 可 数 个 集合 取 并 , 而 且 这 个 并 仍 属于 o 代数 . 此 

外 , 这 还 意味 着 o 代数 中 任意 一 个 集合 的 补 集 也 属于 o 代数 . 但 这 些 并 不 是 我 们 

所 拥有 的 全 部 事实 ! 

。Q 的 任意 一 个 o 代数 2 中 都 包含 g 和 Q. 为 了 看 出 这 一 点 , 设 4 为 了 中 

的 任意 一 个 元 素 (因为 我 们 假设 允 非 空 , 所 以 至 少 存在 一 个 这 样 的 A). 因 

为 对 补 集 封闭 , 所 以 4e 属于 2; 因为 2 也 对 并 封闭 , 所 以 AU 4e e 2. 

但 是 AU 4* = 0, 所 以 Qez2, 进而 推出 0e = gg 也 属于 区 . 

ea 代数 对 可 数 交 是 封闭 的 . 这 意味 着 如 果 Bi es 了 那么 N%1B; 也 属于 也 . 

为 了 得 到 这 一 点 , 设 4 = Be e 2 于 是 有 UY%14; e 2. 请 你 自己 证 明 “ 并 

的 补 集 就 是 补 集 的 交 ”. 这 样 就 得 到 了 (Uj 4;)* = n2 149 e 2 而 后 者 就 

是 B; 的 交 . 

对 于 任意 给 定 的 集合 9, 我 们 至 少 能 找到 它 的 一 个 o 代数 : 令 了 = {52,Q}. 换 

名 话说, 中 只 有 空 集 和 全 集 9. 请 你 验证 一 下 上 面 两 条 性 质 是 否 成 立 . 这 个 例子 

太平 凡 了 , 并 没有 什么 实际 的 用 处 , 因为 我 们 只 能 对 “有 事 发 生 ” 和 “什么 都 没 发 
生 ” 这 两 个 事件 分 配 概率 . 

我 们 再 看 一 个 更 有 趣 的 例子 . 如 果 Q = {1,2,… ,n} 是 一 个 有 限 集 , 那么 也 = 

P(9) 就 是 一 个 o 代数. 这 里 的 P(9) 是 9 的 虞 集 , 即 9 的 全 体 子 集 构成 的 集合 . 

例如 , 当 Q = {1,2} 时 ， 


P(O) 一 {@, {1}, {2}, {1,2}}, 


如 果 Q = {1,2,3}, 那么 
PO) = {9,{1},1{2},{3},41,2},{1,3}, {2,3},{1,2,3}}. 

我 们 仍 把 对 上 述 两 个 条 件 的 验证 留 给 你 . 这 种 情况 比 一 般 情况 更 容易 的 原因 是 , 我 
们 只 有 有 限 多 个 子 集 , 所 以 不 可 能 得 到 不 同 集合 的 可 数 并 . 同样 值得 注意 的 是 , 如 
果 9 及 n 个 元 素 , 那么 P(Q) 就 有 2” 个 元 素 . 但 请 注意 , P(Q) 的 元 素 是 9 的 子 
集 , 而 不 是 9 的 元 素 . 1 和 以 1 为 元 素 的 集合 有 很 大 不 同 . 
回来 看 我 们 的 理论 . 回想 一 下 , 最 初 的 问题 是 定义 事件 的 概率 . 那么 我 们 为 
什么 要 谈论 o 代数 呢 ? 原因 是 飞镖 问题 的 解决 方案 涉及 了 考察 范围 的 缩小 . 我 们 
不 需要 对 结果 空间 Q 的 每 一 个 子 集 定 义 概 率 , 只 需要 对 o 代数 习 中 的 元 素 定 义 概 
率 就 行 了 . 我 们 把 2 中 的 元 素 称 为 事件 . 


©O 


©O 
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最 初 , 我 们 希望 能 够 讨论 8 的 人 


FE 何 子 集 的 概率 . 但 


是 后 来 改变 了 方向 , 现在 要 


说 的 是 , 某 些 子 集 不 会 被 分 配 概率 . 就 现实 世界 的 应 用 而 言 , 这 不 是 一 个 大 问题 , 因 


为 o 代数 集 包 含 了 我 们 想 研究 的 所 有 “自然 ”集合 , 但 


不 包含 那些 导致 巴 拿 赫 - 塔 


尔 斯 基 悖 论 的 令 人 讨厌 的 集 . 使 用 这 个 定义 , 那些 期 望 能 够 保留 的 性 质 就 能 成 立 . 


( 柯 尔 莫 戈 洛 夫 的 ) 概率 公理 : 设 是 结果 空间 Q 的 一 个 o 代数 . 我 们 可 以 定 
义 一 个 概率 函数 Prob : 一 [0,1]. 换言之 , 可 以 为 允 中 满足 以 下 性 质 的 每 个 元 


素 分 


配 一 个 0 和 1 之 间 的 概率 . 
(1) 对 于 任意 的 事件 4 e 7, 均 有 0<Pr(A)<1. 


第 一 公理 . 


(2) 如 果 Q 是 结果 空间 , 那么 Pr(Q) = 1. 这 有 时 被 称 为 概率 第 二 公理 . 


有 些 教材 会 称 之 为 概率 


所 


(3) 如 果 {4i} 是 习 中 可 数 个 两 两 互 不 相交 的 集合 ,那么 Pr(Ui4;) = 
;Pr(4;)， 你 应 该 能 够 想到 ， 这 通常 被 称 为 概率 第 三 公理 .由 此 可 


以 直接 推出 的 一 个 重要 结果 是 全 概率 公式 ， 


论 : Pr(4) 十 Pr(4°) =1. 另外 , 如 果 4 CB, 那么 Pr(4) < Pr(B). 


稍 后 我 们 将 更 详细 地 讨 


我 们 把 三 元 组 (Q,2, Prob) 称 为 概率 空间 . 对 容许 o 代数 的 完整 描述 远 远 超出 


了 本 书 的 范围 , 还 需要 分 析 学 和 点 集 拓扑 学 的 知识 . 感 兴趣 的 读者 可 以 阅读 [Foll]. 
在 很 多 情况 下 , 我 们 不 需要 指定 o 代数 , 而 更 喜欢 说 :“ 按 照 下 列 方式 生成 的 o 代 


数 .” 当 讨论 各 种 常见 的 概率 空间 时 , 我 们 的 意思 将 变 得 更 加 清晰 . 
。 设 0 是 正 整 数 集 , 是 9 的 全 体 子 集 的 集合 , Prop 是 任意 一 个 满足 疡 


nk 


Pr({n}) = 1 的 非 负 函 数 , 其 中 Pr({n}) 表示 得 到 n 的 概率 . 这 是 最 重要 的 
例子 之 一 , 我 们 到 处 都 能 看 到 它 . 例如 , 抛 扼 一 枚 均匀 的 硬币 , 首次 出 现 正面 
时 的 抛掷 总 次 数 ; 一 个 团队 在 比赛 中 得 到 的 分 数 ; 报税 单数 字 的 头号 ; 股票 
价格 ( 美 分 ); 霍 默 ”辛普森 没有 在 核电 站 造成 事故 的 天 数 ; 在 特定 时 间 内 想 


看 电影 的 人 数 ; 等 等 . 


设 Q = [0,1],o 代数 是 由 [0,1] 的 全 体 开 子 集 (a,5) 构成 的 集合 ,并 设 


Pr((a,0)) = 5 一 a， 这 是 另外 一 个 重要 的 例子 . 
票 投掷 问题 . (想象 一 下 , 在 酒吧 里 有 一 些 非常 清 
到 一 条 给 定 的 线 上 ! ) 这 样 我 们 就 能 对 [0,1] 上 
简单 起 见 , 假设 xz € (0,1). 于 是 

{zx} = ([0, x) U (x, 1])”. 


它们 的 补 集 也 在 o 代数 中 
{z] 的 概率 是 多 少 ? 因为 


这 等 价 于 一 维 情形 下 的 飞 
醒 的 人 , 他 们 总 能 把 飞镖 扔 
的 任意 一 点 分 配 概率 . 为 了 


因为 这 两 个 区 间 在 [0,1] 中 都 是 开 的 , 所 以 它们 在 o 代数 中 也 是 开 的 . 因此 ， 
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Pr([0, x) U (x,1]) = Pr([0, 2)) + Pr((z,1]))= z+ (1—27z)=1, 
所 以 Pr({x}) = 0. 这 好 像 与 我 们 前 面 遇 到 的 问题 一 样 . 虽然 飞镖 落 在 z 点 
的 概率 是 0, 但 它 肯 定 会 落 在 某 个 点 上 . 这 是 否 意味 着 
1 = Pr(I0, 1]) 


-| U 中 = 》 Pr({2}) 
ZE[0,1] ZE[0,1] 
= >》 =0? 


ZE[0,1] 
答案 是 “不 ”! 解释 如 下 : 我 们 只 知道 , 对 于 c 代数 中 的 可 数 个 元 素 , 它们 的 
并 的 概率 就 等 于 各 自 概率 之 和 . 但 此 时 出 现 的 是 不 可 数 个 集合 的 并 . 如 果 你 
不 熟悉 可 数 集 和 不 可 数 集 , 请 参阅 附录 C. 
我 们 说 过 , 当 试 图 给 不 可 数 集 的 每 一 个 事件 分 配 概率 时 , 就 会 出 现 诬 烦 . 在 单 
位 圆 上 扔 飞镖 的 例子 在 某 种 程度 上 具有 误导 性 .结果 表明 , 我 们 无 法 对 不 可 数 生 
定义 一 个 均匀 的 概率 函数 , 即 集合 中 的 每 个 元 素 都 具有 相同 概率 的 概率 函数 . 实际 
上 , 我 们 也 不 能 对 可 数 的 无 限 集 定义 均匀 的 概率 函数 . 可 数 集 与 不 可 数 集 之 间 的 真 
正 区 别 如 下 : 对 于 一 个 不 可 数 集 4, 不 存在 满足 下 列 条 件 的 概率 函数 :对 任意 的 
a € 4 均 有 Pr(a) > 0, 并 且 ,aPr(a) = 1 男 一 方面 , 如 果 B 是 一 个 可 数 集 ， 
那么 我 们 可 以 找到 1 个 概率 函数 , 使 得 Pr(b) > 0 对 所 有 的 pe B 均 成 立 , 并 且 
2veB Pr(b)=1. 
我 们 将 详细 地 讨论 可 数 无 限 集 的 情况 , 并 简单 地 说 一 下 不 可 数 集 的 情形 . 对 于 
可 数 集 , 考虑 下 列 情形 : 当 n 是 非 负 整数 时 , Pr(n) = 1/2"+1; 否则 , Pr(n) = 0. 显 
然 , 这 个 概率 是 非 负 的 . 利用 第 1 章 的 几何 级 数 展开 式 , 我 们 看 到 它们 的 和 就 是 1. 
回忆 一 下 几何 级 数 公式 , 当 |r| < 1 时 有 


a 

> ar” 一 一 . 
1—r 

= 


在 这 里 , 1/2"+1 就 等 于 1/2 . 1/2". 因此 a = 1/2, 7 = 1/2, 那么 概率 之 和 就 等 


人 


对 于 不 可 数 集 , 必须 把 正 的 概率 分 配给 不 可 数 个 事件 . 我 们 看 一 下 事件 4 它 
是 4 中 所 有 概率 属于 (二 ,3] 的 元 素 的 集合 . 像 4。 这 样 的 子 集 有 可 数 多 个 ; 因为 


nt+l’n 
4 中 每 个 事件 的 概率 都 是 正 的 , 所 以 每 个 事件 都 一 定 属于 某 个 4,. 因此 
地 = 
答 王 二 


那么 至 少 有 一 个 4" 包含 了 无 穷 多 个 元 素 , 否则 4 中 只 能 包含 可 数 个 元 素 (我 们 会 
用 到 集合 论 附录 中 的 一 些 结果 , 尤其 是 “可 数 集 的 可 数 并 包含 了 可 数 多 个 元 素 ”). 
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因此 , 存在 某 个 m 使 得 4 中 包含 无 穷 多 个 元 素 , } 


每 个 元 素 的 概率 至 少 为 


1 
Ta 十 1 


我 们 得 出 了 一 个 矛盾 我 们 刚 


三 


专 


刚 证 明了 4 的 概率 为 无 穷 大 , 但 
后 , 我 们 来 看 看 标准 的 不 可 测 集 , 它 是 数学 中 最 麻烦 的 集合 之 一 . 引入 这 个 


例子 是 为 了 保持 完整 性 , 如 果 有 时 间 , 你 可 以 简单 浏览 


下 这 部 分 内 


这 是 不 可 能 的 ! 


容 ! 它 的 存在 


依赖 于 (不 可 数 的 ) 选择 公理 , 而 且 它 是 巴 拿 赫 - 塔 尔 斯 基 悖 论 的 起 因 . 事实 上 , 这 


就 是 我 不 喜欢 给 出 “选择 公理 ”的 原 
要 它 , 所 以 这 是 为 了 他 们 ). 不 管 怎样 ， 
两 个 数 , 如 果 它 们 的 差 是 个 有 理 数 ,为 


中 取 蝇 


因 (但 我 的 许多 好 朋友 都 是 代数 学 家 , 他 们 需 
现在 来 看 看 这 个 集合 . 设 x 和 wy 是 [0,1] 中 的 
bP 么 就 说 zx 和 y 是 等 价 的 , 并 记 作 z ~ vy. 
[x] = {y € [0,1] :vy ~ zz}. 利用 选择 公理 , 从 [0,1] 的 每 个 等 价 类 


今 


tH 一 个 元 素 , 这 


样 就 得 到 了 一 个 集合 N， 也 许 NM 看 起 来 像 {0, V2/2, 7/4,…}. 对 于 有 理 数 7, 令 


N;:= {z+r:7r EN}NI|,1. 
不 难 证 明 , 如 果 ri 夭 r2，, 忆 


是 


Bp 么 NM NN 就 


存在 zi 天 7Z2 使 得 zi +ri = zz 十 ra. 整理 可 得 zl = 022 十 72 一 71， 这 意味 着 TX1 ~ V2, 


但 这 与 N 
写成 这 些 NV 的 可 数 并 : [0,1] = UreoANA. 

如 果 集 合 是 [0, 1] 的 子 集 , 那么 将 概率 与 “长 度 ” 
给 出 一 个 公理 : 如 果 
4+7r 具有 相同 的 概率 . 这 似乎 是 合理 的 
不 会 改变 它 的 长 度 , 对 吗 ? 这 是 一 维 情形 下 的 巴 
移 不 会 改变 体积 . 让 我 们 看 看 这 样 会 发 生 什么 ! 

有 条 概率 公理 说 的 是 , 对 于 可 数 个 互 不 相交 的 集 
自 的 概率 之 和 . 每 个 集合 都 是 由 An 
里 的 概率 就 等 于 长 度 ), 这 使 我 们 
个 相同 的 被 加 数 . 如 果 每 个 被 力 


会 


如 果 每 个 被 加 数 都 是 正 的 , 那么 概率 之 和 就 是 无 穷 大 ! 我 们 无 法 对 NM 分 配 


不 过 , 我 们 从 前 面 的 例子 中 
到 过 不 可 数 个 集合 . 在 这 里 
会 以 一 种 糟糕 的 方式 排列 ( 
包含 不 可 
事项 . 


/ 


2 我 ) 
这 些 集合 的 结构 与 


2.7 


学 生 们 经 党 
中 


se /日 


的 定义 相互 矛盾 (每 个 等 价 类 恰 有 一 个 代表 元 属 


于 WN). 


已 
岗 


合 , 它们 的 3 
平移 得 到 的 , 并 且 平移 不 
陷入 了 困境 . 概率 之 和 必须 为 1, 但 这 里 有 无 穷 多 
I 数 都 是 0, 那么 [0,4] 的 总 概率 (或 长 度 ) 就 是 0; 但 


联系 起 来 是 很 自然 的 . 我 们 再 
4 是 一 个 集合 , A 十 7 是 通过 4 的 平移 变换 得 到 的 , 那么 4 和 


因此 , [0,1] 可 以 


只 对 一 个 集合 进行 简单 的 平移 应 i 
赫 - 


塔 尔 斯 基 悖 论 ， 


Xt 


Nl 


贞 设 旋转 和 


的 


人 .局 / 
ES 


响 概率 


概率 就 等 于 各 
( 记 住 这 


吸取 了 一 个 很 大 的 教训 . 在 以 前 的 讨论 中 , 我 们 谈 


民 大 的 不 


只 有 可 数 个 集合 , 但 每 个 集合 中 的 不 可 数 个 元 素 
区 间 [a, 6] 有 


同 , 但 [中 也 


数 个 元 素 ). 另外 , 你 应 该 把 这 个 例子 看 作 警 示 , 提醒 你 需要 注意 的 问题 和 


附录 : 实验 性 地 找 出 规律 
说 , 虽然 他 们 可 以 根据 给 出 的 细节 去 逐 行 地 旭 


本 


己 能 够 独立 想 出 其 中 的 逻辑 关联 ， 数 学 中 最 鸡 


掌握 的 技能 之 


守 


E 解 一 个 证 明 , 但 并 不 


一 是 了 解 什么 


2.7 附录 : 实验 性 地 找 出 规律 ”73 


是 正确 的 , 什么 是 你 应 该 证 明 的 . 本 节 的 目的 是 帮助 你 找 出 其 中 的 规律 . 如 果 你 知 
道 应 该 试 着 证 明 什么 , 那么 证 明 起 来 就 更 容易 了 ! 

概率 论 中 的 一 个 重要 例子 是 Pr(AUB) 的 公式 . 我 们 先 从 你 了 解 的 一 个 微 积 4 
结果 开始 , 然后 用 它 来 介绍 一 些 重要 的 技巧 . 从 某 种 意义 上 说 , 我 们 所 做 的 几乎 是 
实验 性 的 数学 : 考察 一 些 特殊 情况 , 并 试 着 利用 其 找 出 一 般 模式 . 请 注意 , 我 们 给 出 
的 公式 并 没有 经 过 严格 证 明 , 但 至 少 我 们 现在 有 了 目标 . 


2.7.1 ”乘积 求 导 法 则 


前 面谈 到 了 概率 规则 的 愿望 列表 . 当然 , 没有 什么 可 以 阻止 我 们 创建 其 他 列表 . 
我 们 来 回顾 一 下 微 积 分 的 知识 . 虽然 求 和 法 则 很 好 (和 的 导数 等 于 导数 之 和 ), 但 是 
乘积 和 链 式 法 则 绝对 不 是 我 们 想象 的 那样 ! 

例如 , 如 果 Atz) = f(z)g(7z), 那么 我 们 想象 中 的 结果 应 该 是 h(xz) = f(x)g'(z)， 
即 乘积 的 导数 是 导数 的 乘积 (同样 地 , 我 们 也 和 希望 商 的 导数 是 导数 的 商 )， 很 不 幸 ， 
这 当然 是 不 正确 的 , 应 该 是 h(x) = f(z)g(z) + jz)g(z). 学 生 第 一 次 看 到 这 个 公 
式 时 会 觉得 它 很 奇怪 , 根本 不 直观 . 我 们 接 下 来 的 目标 就 是 , 通过 尝试 特殊 的 f 和 
g 来 解释 如 何 猜 出 这 个 公式 . 

我 们 应 该 如 何 选择 f 和 9? 对 于 这 两 个 函数 , 我 们 不 仅 要 知道 它们 各 自 的 导 
数 , 还 要 知道 它们 乘积 的 导数 .这 提醒 我 们 应 该 把 f 和 9 取 作 人 简单 的 纯 多 项 式 ， 
比如 f(x) = zm 和 g(xz) = xz”, 其 中 m 和 n 是 两 个 正 整数 注意, 此 时 我 们 有 
h(x)= 2™+", 并 且 Wr) = m+n)r™t"l. 

现在 该 如 何 推出 乘积 的 求 导 公 式 呢 ?我 们 有 理由 相信 答案 取决 于 以 下 输入 : f(z)， 
f(x), g(z) 和 g'(x). 这 为 我 们 提供 了 以 下 几 点 : 


网 


注意 , 在 h(x) 中 , x 的 索 是 m +n 一 1; 因此, 我们 自然 会 问 如 何 利 用 上 面 
的 信息 得 出 z™t"*-1 这 一 项 . 这 里 有 两 种 显而易见 的 方法 : f(x)g(x) = mz™+"-1 
和 f(z)g(z) = nzmt+n 1 神奇 的 是 , 把 这 两 个 式 子 加 起 来 就 得 到 了 (xz), 这 表明 
f(z)g(z) 的 导数 可 能 就 是 f(z)g(x) 十 f(x)g (zx)! 

同样 , 重要 的 是 要 注意 这 不 是 一 个 证 明 , 但 是 给 了 我 们 一 个 理论 分 析 的 目标 . 看 
一 下 乘积 法 则 的 标准 证 明 , 你 会 发 现 它 从 导数 的 定义 开始 , 然后 采用 一 种 聪明 的 加 
零 方 式 , 进而 得 出 了 上 面 的 两 项 . 

最 后 , 值得 一 提 的 是 , 找 找 其 他 例子 来 支持 我 们 看 到 的 东西 . 例子 越 多 , 我 们 就 
越 有 信心 . 虽然 我 们 很 自然 地 找到 了 f(z)g(z) 和 f(z)g'(z)( 因 为 它们 给 出 了 zx 的 
正确 方 容 ), 但 还 存在 很 多 其 他 的 表达 式 , 比如 f(z)g(zx)/z 和 zf'(z)g'(z)! 
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昌 然 有 无 穷 多 种 可 能 性 , 但 有 些 选择 确实 比 其 他 的 更 自然 . 另外 , 我 们 可 以 看 
看 其 他 的 例子 ; 只 要 能 够 计算 出 乘积 的 导数 , 就 有 望 缩 小 可 能 性 的 范围 . 另 一 个 很 
好 的 选择 是 取 f(x) = sin(z) 和 g(x) = cos(z). 但 这 个 例子 有 点 难 , 因为 我 们 需要 知 
道 一 些 三 角 公 式 来 简化 分 析 (从 h(xz) = sin(z) cos(z) 可 以 改写 为 h(x) = 3 sin(2x) 
开始 )， 如 果 我 们 不 记得 那个 三 角 恒 等 式 , 那么 就 得 不 到 导数 已 知 的 乘积 . (尽管 我 
们 需要 知道 一 个 简单 的 结果 , 即 链 式 法 则 的 一 种 特殊 情况 ! ) 
2.7.2 ”并 的 概率 

现在 来 看 我 们 的 主要 目标 , 试 着 解释 如 何 

Pr(AUB)= Pr(A)+Pr(B)— Pr(ANMB). 
推测 Pr(4U B) 是 Pr(4), Pr(B) 和 Pr(AmB) 的 函数 是 有 道理 的 . 为 什么 呢 ? 我 们 
从 集合 4 与 B 入 手 , 自然 也 会 考虑 到 两 者 的 交集 4n B. 我 们 希望 Pr(4U B) 就 
是 它们 的 函数 . 首先 假设 它 是 一 个 多 项 式 , 即 
Pr(AUB)=ci1+t coPr(A)+ csPr(B)+ caPr(ANB) 

+ csPr(A)? + cePr(A)Pr(B) 
+ crPr(A)Pr(ANMB)+ cePr(B)? 十 … 


让 LH 
1 


他 


注意 , 这 里 有 很 多 的 可 能 项 ! 

为 了 减少 这 些 可 能 性 , 我 们 考虑 特殊 情形 下 的 4 和 B, 并 看 看 这 些 系数 c; 都 
是 什么 . 我 们 从 简单 的 情形 开始 . 看 看 如 果 只 考虑 常数 项 和 线性 项 , 能 否 找 到 一 个 
好 的 候选 对 象 (如 果 找 不 到 , 那 就 要 考虑 更 复杂 的 情形 )， 因此， 现在 的 目标 就 是 找 
到 cl 、cz、cs 和 c4, 使 得 


Pr(AUB)= ci1+coPr(A)+ csPr(B)+ cPr(ANB). 


是 时 候 为 4 和 B 选择 一 组 特殊 值 了 . 最 容易 处 理 的 集合 是 空 集 g 和 整个 空 
间 Q, 因为 我 们 知道 它们 的 概率 以 及 它们 的 交 与 3 
。 如 果 令 A4= B=&%g, 那么 Pr(4UB)=0 且 Pr(4)=Pr(B)=Pr(A4NB)=0. 
因此 , 一 定 有 cl = 0. 
。 如 果 令 A4= B=Q, 那么 Pr(4UB)=1 且 Pr(4) =Pr(B) = Pr(4nEB) = 1 
那么 一 定 有 ca + ca 二 cd = 1. 
。 如 果 令 B= 2, 那么 Pr(4U B) = Pr(4) 且 Pr(B) = Pr(4nB) = 0, 这 意味 
着 cs = 1. 
。 可 以 重复 上 面 的 论证 , 现在 令 4 = 2 我 们 会 发 现 cs = 1, 但 是 没 必要 这 样 做 . 
由 于 我 们 无 法 区 分 集合 4 与 B 之 间 的 差异 , 所 以 由 对 称 性 可 知 cs = cs( 注 
意 Pr(4U B)= Pr(BU A)). 


不 需要 通过 考察 更 多 的 例子 来 得 到 ct, 因为 我 们 知 


;党 


起 


cz 十 cs 十 ci = 二 1, 并且 


c = cs=1 所 以 一 定 有 c = -1. 把 这 些 结果 结合 起 来 , 就 推测 出 了 


注意 , 只 探究 


些 基本 届 


Pr(AUB)= Pr(A)+Pr(B)— Pr(ANMB). 
了 形 , 我 们 就 能 得 出 正确 的 公式 ! 

我 们 有 必要 回 过 头 来 看 看 都 做 过 些 什 么 
门 得 到 了 关于 并 的 概率 公式 的 证 


. 从 某 种 意义 上 说 , 做 这 些 事情 没有 必 
明 . 从 另 一 个 角度 看 , 这 长 远 来 说 是 很 


有 用 的 . 为 什么 ? 本 节 的 目的 是 帮助 你 在 新 的 、 不 熟悉 的 情况 下 找 出 答案 , 并 希望 
这 种 论证 方法 能 在 以 后 为 你 带 来 巨大 收获 . 


我 们 在 本 草 付 日 


2.8 


总 结 


那 就 能 学 着 去 描述 这 门 课 , 但 是 先 学 会 术语 是 很 重要 的 . 


语言 很 重要 . 


We 
的 注意 . 


| 


Ll 


Hh 了 柯 尔 莫 戈 洛 夫 的 概率 公理 


讨 了 其 推论 ， 


习题 2.9.1 


习题 2.9.2 


最 后 , 我 们 引述 奥 威 尔 有 有 
习 一 门 学 科 并 掌握 定义 时 , 或 者 当 你 选择 


我 们 介绍 
这 些 术 语 在 概率 的 公理 化 方面 至 关 重 要 ， 


个 很 棒 的 例子 是 乔治 
(Newspeak 语言 ) 旨 在 限制 思想 . 当 


选择 好 的 名 字 , 还 要 关注 以 什么 来 命名 . 我 们 给 台 


奥 威 尔 的 书 《1984》, 内 
然 , 我 们 在 数学 上 的 目标 是 相反 的 . 我 们 不 仅 要 
EE 要 的 概念 命名 , 是 为 了 引起 人 们 


上 了 努力 , 在 下 一 章 即将 迎 来 收获 既然 你 掌握 了 概率 的 语言 ， 


中 的 “新 语 ” 


了 集合 论 的 标准 


概念 和 符号 ， 


基础 , 3 


通过 理论 (事件 的 


以 及 点 集 拓扑 中 的 一 些 知识 . 
而 且 有 助 于 我 们 避免 迟 论 和 陷阱 . 我 们 给 
既 率 规则 ) 和 几 个 例子 探 


E《 政 治 与 英语 》(1946) 一 书 


Ar 口 


的 一 段 话 . 当 你 开始 学 


符号 时 , 请 记 住 这 


站 
点 . 奥 威 尔 写 道 : 


一 位 严谨 的 作家 在 写 每 一 句 话 的 时 候 , 会 至 少 问 自己 四 个 问题 : (1) 
我 想 说 什么 ? (2) 用 什么 词 来 表达 呢 ? (3) 什么 样 的 形象 或 习 语 能 让 意思 
清晰 ? (4) 这 个 形象 的 新 鲜 度 够 不 够 产生 效果 ? 


的 概率 是 多 少 ? 被 抽 到 | 
考虑 集合 4 = 


2.9 习 


考虑 集合 4 = {1;,2,…… ,n}. 随机 和 
可 能 地 被 抽 到 , 那么 被 


到 的 子 集 包含 1 


题 


取 4 的 一 个 子 集 . 如 果 4 的 所 有 子 集 


的 概率 是 多 少 ? 被 


的 子 集 包 含 1 或 2 的 概率 是 多 少 ? 


都 等 
到 的 子 集 同时 包含 1 和 2 


取 4 的 一 个 子 集 . 如 果 4 的 所 有 子 集 都 等 
可 能 地 被 抽 到 , 那么 被 抽 到 的 子 集 有 偶数 个 元 素 的 概率 是 多 少 ? 答案 是 否 依赖 于 n? 如 果 
是 , 那么 n 为 偶数 与 n 为 奇数 的 情形 , 哪个 更 容易 处 理 ? 
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A 
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习题 2.9.3 ”找到 满足 |4| = |B| 的 集合 4 与 B, 其 中 4 是 实 
的 一 个 子 集 , 但 不 是 任何 直线 的 子 集 
设 P(X) 是 集合 X 的 客 集 . 
B) = P(A)UP(B) 是 否 成 立 ? 订 
PC4mnB)=P4)nP(B) 是 否 成 立 ? 证 明 你 的 答案 . 


习题 2.9.4 


习题 2.9.5 


atu 


I 


设 A 和 B 是 两 个 互 不 相交 的 非 空 才 


和 线 的 子 集 , B 是 平面 ( 即 R?) 


限 集 . P(AU 


E 明 你 的 答案 


习题 2.9.6 ”PP(P(A)UP(B)) 和 P(P(4AU B)) 之 间 有 关系 吗 ? 如 果 有 , 是 什么 关系 ? 


习题 2.9.7 
习题 2.9.8 


习题 2.9.9 


习题 2.9.10 


习题 2.9.11 
习题 2.9.12 


习题 2.9.13 


习题 2.9.14 


习题 2.9.15 
习题 2.9.16 


习题 2.9.17 
习题 2.9.18 
习题 2.9.19 


习题 2.9.20 
选中 时 ,计数 方法 是 可 行 的 ， 也 就 是 说 , 9 = {a1,a2,… ,an}， 并 
,n} 均 有 Pr(ai) = 1/n. 


习题 2.9.21 F 明 : Pr(4)+Pr(4*) =1, 并 且 当 ACB 时 


设 4 是 元 素 个 数 为 


n > 0 的 有 限 集 . 设 Pi(4) 


P(A), 并 且 当 m > 2 时 有 


Pm(A) = Pm-1(A). 是 否 存在 关于 Pan(4) 大 小 的 公式 ? 如 果 存 在 , 这 个 公式 是 什么 ? 


我 们 讨论 了 如 何 利 
{{2}}, {{{2}}}, {{{{g}}}} 
如 果 4 中 的 每 个 元 素 都 在 B 中 ， 


从 


RE Ss 


这 


A 与 B 相等. 
限 多 个 . 


设 n 是 任意 一 个 正 整数 . 训 


包含 无 穷 多 个 元 素 吗 ? 


写 一 些 关于 连 纪 


假设 在 


两 个 事件 4 和 已 , 其 


0.2. 那么 Pr(4 


假设 有 三 


UB) 


la} 


是 多 少 ? 


个 事 人 


F A,B 和 CC, 


Pr((BUC) 
B)U((BUC 


> 


Ne 


站 


的 概率 . 稍 后 我 们 将 看 到 , 交集 通常 更 容易 计算 ( 交 表 示 每 个 事件 都 必须 发 生 , 但 


N A) = 0.3 
A)) 是 多 少 ? 
证 明 Pr(AU 


Pr(ANBNMCOC) 


假设 存在 一 个 从 集合 4 到 正 实数 集 的 一 对 一 函数 f, 但 


j 空 集 构造 整数 集 . 从 空 集 开 始 , 我 们 还 可 以 构造 集合 {@}， 
比 我 们 以 前 做 得 更 好 还 是 更 糟 ? 为 什么 ? 


并 且 B 中 的 每 个 元 素 也 都 在 4 中 , 那么 集合 
E 明 或 反驳 : 恰 有 m 个 元 素 的 不 同 集合 只 有 有 


信人 


已 不 是 映 上 的 . 4 必须 


统 假设 的 内 容 , 不 超过 一 段 . 
中 Pr(4) = 0.3, Pr(B) = 0.6, 并 且 Pr(4n B*) = 


其 中 Pr((4UB)JnC) = 0.3, Pr((4uCJnB) = 0.3， 


= 0.1. 那么 Pr((4UB)nC)U(4UC)nmn 


B) = Pr(A) + Pr(B) 


着 至 少 有 一 个 事件 发 生 ). 


差 . 如 果 存在 四 


例子 )， 


是 闭 的 . 


给 出 一 个 开 集 
用 儿 旬 话 来 证 明 你 的 答案 . 
设 A={(z,):|z 二 让 < 直 ，B={(z, 奶 :|z 十 |< 直 . 证 明 ; 4 是 开 的 , B 


E 测 


个 关于 Pr(4U BUCO) 的 公式 ， 
个 (或 更 多 个 ) 集合 呢 ? 一 般 情 况 
、 一 个 闭 集 和 一 个 既 不 开 


ij 交 的 概率 表示 并 

意味 
使 其 表示 为 交集 的 和 与 
下 的 答案 就 是 容 斥 公式 (参见 第 5 章 )， 
也 不 闭 的 集合 (你 不 可 以 使 用 本 书 中 的 


Pr(An B) 时 , 我 们 


证 明 或 反 驱 : 开 集 的 可 数 并 是 开 的 . 

证 明 或 反 驱 : 开 集 的 可 数 交 是 开 的 . 

对 于 独立 地 抛 撕 一 枚 硬币 两 次 , 并 且 每 次 出 现 正面 的 概率 是 70% 的 实验 , 其 概 
率 树 的 最 后 一 行 有 四 个 数 . 中 间 的 两 个 数 相等 , 这 是 巧合 吗 ? 如 果 抛 撕 三 次 , 你 认为 会 有 
什么 结果 ? 

利用 概率 公理 证 明 : 当 9 中 存在 有 限 多 个 元 素 , 并 且 每 个 元 素 都 等 可 能 地 被 


人 2 


利用 概率 


公 忆 


对 于 每 一 个 i € 


1 训 


,有 Pr(A) < Pr(B). 


习题 2.9.22 
习题 2.9.23 
习题 2.9.24 


2.9.25 “抛掷 
这 是 


1 2.9.26 


如 果 


设 Zi = {1,2,… ,n}. 不 包含 Zn 
如 , {1, 4, 6,12, 15} 和 {1, 4, 6, 12, 15, 20} 都 是 Z2o 满足 上 述 条 们 
不 是 . 如 果 还 要 求 n 也 在 子 集中 
编写 程序 或 手动 计算 n 


E 要 做 的 工作 与 本 书 


任意 


FP, 那么 现在 满足 条 件 


设 Q = 行 ,… ,100}. 找 出 一 个 o 代数 ,使 其 既 不 是 {g,Q} 也 不 是 P(9). 
给 出 “ 空 集 的 概率 为 0” 的 另 一 种 证 明 . 


的 


两 个 相 邻 元 素 的 子 集 共 有 多 少 个 ? 例 


的 子 集 , 但 {1, 4, 5, 12, 15} 
有 多 少 个 ? 对 于 这 样 的 练习 ， 


子 自 


我 1 


取 值 较 小 时 的 答案 是 有 
5 颗 均 匀 的 山子 , 计算 1 
FP 的 补充 方法 进行 比较 . 
J] 微 函数 , 订 


口 


ff 和 9g 都 是 


重点 说 明 在 哪 


有 加 0. 


题 2.9.27 设 f{ 


价值 
丛 好 掷 出 天 个 6 的 概率 


上 
的 
Hy), 


FE 明 : 乘积 f(x)g(z 


门 可 以 据 此 找 出 规律 . 
比 中 k=0,1,... ,5. 把 


) 一 


有 旺 . 
全 


数 是 f(z)g(z)+f(z)g (7). 


An}?21 是 由 可 数 个 寻 


证 明 : 所 有 An 
2.9.28 ”想象 


的 交集 的 概率 是 1. 
一 下 , 在 犯罪 现场 发 现 了 指纹 训 


F 构 成 的 序列 , 并 


E 据 . 它 与 一 个 人 
该 证 据 与 一 个 包含 30 000 个 人 的 指纹 数据 库 相 比较 . 求 出 它 至 少 与 数 ] 


的 概率 . 

习题 2.9.29 ”在 上 一 个 习题 中 , 如 果 罪 犯 的 指纹 包含 在 数 
匹配 的 预期 人 数 . 

习题 2.9.30 ”假设 艾滋 病毒 
年 8 月 24 日 报道 的 数字 )， 如 果 病 毒 的 传播 率 为 1%， 


时 , 计算 感染 的 风险 . 


1 2.9.31 


1000 次 时 , 感染 的 概率 是 多 少 ? 对 于 较 大 


在 这 种 环境 下 
2.9.32 。 想象 
设 下 月 


的 概率 是 (1 


的 概率 等 
示 , 8 点 到 9 点 的 降雨 概率 为 20%, 9 点 到 10 点 的 降 朋 
有 概率 为 30%, 11 点 到 12 点 


时 , 计算 感染 的 风险 是 多 少 . 
, 你 正在 考 
新 闻 给 出 的 


n 次 
一 下 


六 人 


让 六 天 盐 


的 降 
0.7 


习题 2.9.33 ”想象 


0.8)(1 


0.7)(1 (1 


的 n, 如 果 病 


步 旅行 , 想 扩 
找 出 下 列 分 析 中 的 错误 : 新 闻 的 每 小 时 预报 
有 概率 为 30%, 10 点 到 11 点 的 降 
概率 为 10%， 据 J 
0.9) 心 35%. 这 个 结论 


民 


I 道 在 


对 了 


F 每 个 m 均 有 Pr(An)=1. 


匹配 的 概率 是 1/5000. 将 
B 库 中 一 个 人 匹配 


库 中 , 求 出 数据 库 


F 与 指纹 证 


的 传播 率 介 于 1/100 和 1/1000 之 间 (这 是 洛杉矶 时 报 在 1987 


Da 


某 人 暴露 在 这 种 环境 下 100 次 


在 上 一 个 习题 中 , 假设 病毒 的 传播 率 是 1/1000. 那么 当 某 人 暴露 在 这 种 环境 下 
毒 传播 率 为 1/n, 那么 当 某 人 暴露 


口外 让 


B3 


又 


显 


前 下 雨 的 可 能 性 . 


可 以 得 出 结论 , 在 
E 确 


Ph 午 之 前 下 十 


吗 ? 请 给 出 解释 . 


?7 


如 果 与 它 比 赛 
率 就 是 1 一 p% 


的 两 


支 球 队 需要 在 本 赛季 的 最 后 下 


场 


比赛 中 取得 胜利 才能 进入 淘汰 赛 . 


支 球 队 具 有 互补 怕 


多 少时 , 该 队 i 


入 淘汰 赛 的 概率 能 够 达到 最 大 ? 


习题 2.9.34 “抛掷 


FE (如果 一 队 志 
). 如 果 某 队 的 获胜 概率 是 p%, 那么 它 被 避 


K 胜 的 


概率 是 p%, 那么 另 一 队 获 胜 的 概 
f 败 的 概率 就 是 1 一 p%. 当 p 为 


一 枚 硬币 100 次 , 并 且 每 次 掷 出 


E 面 的 概率 均 为 p. 编写 一 个 程序 来 粗略 


估计 正面 或 反面 的 最 长 游程 (以 较 长 者 为 准 ) 的 平均 长 度 . 尝试 几 个 p 值 , 并 给 出 相应 结 
果 . 

习题 2.9.35 ”在 概率 论 中 , 对 集合 取 并 是 至 关 重 要 的 . Mathematica 具有 内 置 的 “ 求 并 ” 命 
令 , 它 可 以 求 出 输入 集合 的 并 集 , 并 对 其 进行 排序 . 使 用 更 基本 的 命令 来 编写 一 段 代码 ， 
使 得 该 代码 可 以 求 出 两 个 集合 的 并 集 , 并 删除 重复 部 分 . 
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习题 2.9.36 ”Mathematica 有 一 个 内 置 的 “排序 ”函数 , 它 可 以 将 集合 中 的 元 素 按照 从 小 到 
大 的 顺序 排列 (如 果 你 给 出 额外 的 输入 , 它 也 可 以 按照 其 他 顺序 排列 )， 使 用 更 基本 的 命 
令 来 编写 一 段 代 码 , 使 得 该 代码 可 以 把 一 组 实 值 元 素 按照 从 小 到 大 的 顺序 排列 . 

习题 2.9.37 ”我 们 发 现 , 把 概率 分 配给 不 可 数 个 事件 的 并 是 有 问题 的 . 那么 能 否 把 概率 分 配 
给 不 可 数 个 事件 的 交 呢 ? 

习题 2.9.38 ” 设 Q 是 一 个 结果 空间 , 4 和 B 是 满足 Pr(4) = Pr(B) = 1 的 两 个 不 同事 件 
A 和 B 同时 发 生 的 概率 是 多 少 ? 它们 都 不 发 生 的 概率 是 多 少 ? 它们 的 对 称 差 ( 指 的 是 那 


习题 2.9.39 


些 只 属于 其 中 一 个 集合 的 元 素 构 成 的 集合 ) 的 概率 是 多 少 ? 
在 2.7 节 中 , 我 们 讨论 了 如 何 通过 观察 特殊 情形 来 找 出 公式 . 通过 考察 f(z) = 
sin(z), g(x) = cos(z) 和 h(x) = jz)g(z) 来 验证 乘积 法 则 . 你 可 以 使 用 标准 的 三 角 恒 等 


式 , 比如 sin(z) cos(z) 
想象 一 下 , 我 们 试 


习题 2.9.40 


出 问题 了 ? 


习题 2.9.41 


上 2 


在 


2.7 节 上 


法 , 为 Pr(AUBUO) 找到 一 个 类 似 的 公式 . 该 方 涪 


二 
一 没 


sin(2x), 以 及 sin(2z) 的 导数 是 2 cos(2z). 
曾 过 考察 函数 e*、e” 和 e>” 来 猜测 乘积 | 


这 


则 . 哪里 


的 微分 沪 


个 合理 的 例子 . 现在 推广 这 种 方 


E 广 到 | Pr(41iU42 U:: -UAn) 


FP, 为 了 讨论 Pr(4UB), 我 们 挑选 了 
es 


有 全 过 


1 


a 


下 个 问题 涉及 多 项 式 


的 判别 式 A， 


那么 


其 定义 为 根 的 差 所 得 乘积 的 3 


请 注意 , 如 果 两 个 根 是 相等 的 , 那么 判别 式 就 等 


一 工 


jz) = 2 十 an-17” 十 :十 aa7 十 ao 


F 方 . 因此 , 如 果 


(ZT — T(z — 72) (7 — Tn), 


f(z) 


人 一 


I[ (ri — 7;)”. 


1<i<ij<n 
F 0; 否则 , 判别 式 不 为 0. 由 于 根 是 系数 的 函 
| 式 也 是 多 项 式 的 系数 的 函数 . 为 了 简单 起 见 , 我 们 已 经 把 


数 (通常 是 个 复杂 的 函数 )， 
最 高 次 项 的 系数 标准 化 为 1. 探讨 判 
根 就 足以 表明 它 的 研究 价 
三 次 多 项 式 f(x)= z3 十 4z 十 瑟 


在 存在 如 


ee 


项 式 就 是 够 了 ， 


响 根 的 差 )， 下 面 上 


常 有 价值 的 . 
习题 2.9.42 


大 


考察 二 次 多 项 式 f(z) = x? 十 bz 十 c. 为 了 使 这 三 个 物理 


因此 判 另 


别 式 的 重要 性 与 应 用 绕 得 太 远 了 , 但 实际 上 , 能 够 验证 是 


为 我 们 


的 两 个 习题 很 神奇 
计算 一 个 并 的 概率 不 同 , 此 时 我 们 并 不 


须 


有 相同 的 
必须 是 m, 而 c 的 上 


位 . 


值 了 . 二 次 多 项 式 f(zx) = z? 十 bx 十 c 的 判别 式 是 2 一 4， 
的 判别 式 为 -443 - 27B?( 注 意 , 研究 这 种 形式 的 三 次 多 
总 是 可 以 通过 把 z 替换 成 x 一 zo 来 消除 二 次 项 , 这 样 的 平移 不 会 影 
利用 2.7 节 的 技巧 , 我 们 得 出 了 正确 的 形式 ; 然而 , 与 
马上 明确 答案 应 该 是 什么 , 因此 这 种 技巧 在 这 


中 


台 已 
HE 


是 非 


量 可 以 相 加 , 它们 必 
位 来 度量 的 , 那么 5 的 单位 


展 设 z 是 以 米 (mm) 为 


因此 ,如果 我 们 1 


因此 它 的 单位 就 是 m?, 而 


于 判别 式 为 (ri 一 72)”， 


位 必须 是 m7 


2.9 习 题 79 
我 们 很 自然 地 猜 到 它 一 定 具有 oib? + aac 的 形式 , 因为 这 是 得 出 平方 米 最 简单 的 方法 
(另外 , 还 可 能 是 ( 姑 十 c)/( 妇 十 10c). 这 些 论述 不 是 证 明 , 只 是 实验 性 地 尝试 找 出 正确 的 


函数 形式 ). 

以 确定 aa 
庙 2.9.43 

位 记 作 m. 


把 上 一 个 练习 扫 
为 了 使 得 这 三 个 量 


假设 存在 线性 
和 CQ2. 


FE 关系 , 并 


有 相同 的 维度 


m2, B 的 


位 应 该 


表明 了 和 
能 得 到 B1 


能 得 


合 到 


a 和 5 不 应 该 有 
有 这 些 提示 , 仍 有 大 草 
a 和 6b. 当 讨 


习题 2.9.45 


2.9.44 彬 


应 该 等 了 


是 m3 现在 , 
F B143 + PaB?, 假设 这 种 形式 成 立 , 那么 通过 选 3 


癌 别 式 (7 


一 ra)2(rl 一 rs)2(ra 一 rs3)2 的 利 


A = a 十 azc, 那么 通过 选取 恰当 的 上 和 ec 就 可 


E 广 到 三 次 多 项 式 f(z) = 2 上 + 4z 十 巨 上 . 我 们 仍然 把 z 的 单 
且 可 以 相 加 , 不 难看 出 4 的 单位 应 该 是 


位 是 m5, 这 


的 A4 和 B 就 


泽 恰当 


和 62 的 值 


吾 
由 


论 蒙 


系 


,此 时 你 可 以 很 容易 
Bas 是 满足 (zx/a)? 二 (y/5) 
的 猜测 , 使 其 成 为 a 和 5b 的 函数 . (提示 : 你 的 答案 
区 别 . 此 外 , 当 
时 可 能 性 ， 


特 卡 罗 积 分 时 


也 计算 出 根 (从 而 也 章 
?< 1 的 点 (z,9) 的 


i 求 出 了 判别 趟 ) 
集合 . 对 椭圆 的 面积 进 


MA 一 
霖 全 . 1 


a 二， 时 , 它 应 该 退化 成 


三 
由 


中 该 关于 
的 面积 公式 . ) 遗憾 的 是 , 
比如 x 到. 为 了 排除 这 些 可 能 性 , 你 需要 考察 特殊 的 
, 我 们 将 重新 讨论 这 个 习题 

推广 上 一 个 习题 , 猜测 椭 球 体 (z/a)? + (b+ (z/c)”< 1 的 体积 


F ac 和 ?对称 , 也 就 是 说 


? 


使 
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每 一 个 赌 徒 都 知道 ， 
生存 的 秘密 就 是 
知道 要 扔 掉 什 么 ， 
知道 要 保留 什么 . 
一 一 肯 尼 “罗杰斯 《 赌 徒 》(1978) 


在 第 1 章 中 , 我 们 尝试 并 希望 能 成 功 地 激发 你 学 习 概 率 的 兴趣 . 我 们 谈论 了 一 
些 有 趣 的 话题 , 比如 生日 和 篮球 . 接 下 来 的 第 2 章 , 我 们 来 了 个 急 刹 车 , 卷 起 袖子 ， 
不 断 地 接受 来 自 定义 和 公理 的 冲击 . 虽然 这 些 都 很 重要 , 也 很 有 必要 , 却 很 容易 让 
人 感到 不 知 所 措 租 未. 你 可 能 不 想 坐 下 来 记 定 义 而 是 想 要 解决 问题 , 想 看 看 如 何 
使 用 概率 . 
昌 然 没有 适当 的 框架 是 不 可 能 做 到 这 些 的 , 但 在 某 种 程度 上 已 经 足够 了 . 我 们 
先 把 理论 发 展 放 在 一 边 , 去 考察 一 些 问 题 , 而 不 是 向 前 推进 , 继续 探索 公理 的 结果 . 
所 以 , 现在 我 们 不 讨论 独立 性 和 条 件 概 率 , 尽管 这 是 概率 论 中 最 重要 的 两 个 主题 . 我 
们 将 把 这 些 留 到 第 4 章 . 相反 , 我 们 会 把 已 经 学 到 的 东西 应 用 到 一 些 常 见 的 问题 中 ， 


希望 能 重新 激 起 你 对 这 门 课 的 兴趣 . 

好 消息 是 , 我 们 已 经 为 讨论 大 量 有 趣 的 例子 做 好 了 充分 准备 . 我 们 可 能 会 非 正 
式 地 利用 一 些 独 立 事件 的 性 质 , 但 这 些 不 会 超越 我 们 的 日 常 经 验 . 因此 , 本 章 的 例 
子 常常 来 自 于 日 常 经 历 . 虽然 我 们 的 任务 并 不 是 写 下 这 门 课 的 历史 , 但 不 能 不 提 概 
率 论 与 博弈 游戏 的 长 期 联系 . 人 类 撕 般 子 的 历史 已 经 有 5000 多 年 了 , 现在 人 们 玩 


的 是 所 谓 西洋 双 陆 棋 戏 的 各 类 变种 . 而且, 一旦 游戏 开始 , 离 赌博 也 就 不 远 了 . 大 
量 的 概率 知识 被 用 来 分 析 博 弈 游戏 , 寻找 最 优 策略 . 本 章 将 重点 介绍 一 些 这 样 的 游 
戏 , 以 及 一 些 更 平常 的 例子 . 

我 们 将 探索 纸牌 游戏 , 如 扑克 牌 、 单 人 纸牌 和 桥牌 . 这 些 都 是 练习 计算 离散 事 
件 概率 的 绝 佳 机 会 , 比如 拿 到 一 手 特定 牌 的 概率 . 在 开始 这 些 问题 之 前 , 让 我 给 你 
一 些 动力 . 乍 一 看 , 这 些 似乎 与 概率 没什么 关系 , 但 请 记 住 : 概率 和 计数 是 不 可 分 
割 的 . 如 果 可 以 计数 , 那么 我 们 就 能 通过 将 所 需 属性 的 事件 个 数 除 以 可 能 事件 的 总 
个 数 来 求 出 概率 . 因此 , 当 你 阅读 本 章 中 所 有 与 计数 有 关 的 论述 时 , 请 牢记 这 一 点 : 
要 想 掌 握 概率 , 就 要 掌握 计数 . 你 可 能 并 不 关心 这 里 讨论 的 游戏 , 但 重要 的 是 了 解 
如 何 解决 这 些 问题 . 即使 你 从 不 玩 扑 克 牌 、 单 人 纸牌 和 桥牌 , 你 也 可 以 从 这 些 游戏 
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的 计数 问题 中 学 到 很 多 东西 . 
事实 上 , 本 章 中 出 现 的 很 多 问 


题 都 涉及 决定 事件 概率 的 最 基本 概念 , 比如 独立 


性 和 条 件 概率 . 因此 , 本 章 是 向 第 4 章 的 过 渡 . 换 句 话说, 我们 将 尽 可 能 地 只 利用 第 


2 草 的 知识 来 分 析 这 些 问题 , 然后 


看 看 会 在 哪里 卡 住 . 为 了 解决 这 些 问题 , 我 们 需 


要 更 多 地 了 解 基本 理论 . 之 后 , 我 们 会 回 过 头 来 研究 更 多 的 基本 概率 问题 , 但 将 使 


用 更 加 强大 的 技巧 . 


最 后 , 给 那些 想 在 看 完 本 章 后 去 赌场 的 人 一 些 建议 : 记 住 , 赌场 也 雇用 数学 家 ， 


而 且 他 们 读 过 的 内 容 可 不 仅仅 是 这 一 章 ! (对 于 那些 坚持 要 去 赌场 的 人 , 请 阅读 第 


23 章 . ) 
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现在 , 你 因 赌博 成 功 的 想法 而 感到 兴奋 , 但 我 不 得 不 要 求 你 暂停 一 下 , 有 一 些 
基本 的 组 合 知识 需要 掌握 . 为 了 成 功 地 解决 这 些 问题 , 需要 一 些 函数 . 我 们 将 尽快 
介绍 这 些 概 念 , 然后 去 考察 它们 的 应 用 . 所 以 , 接 下 来 的 两 小 节 不 会 有 太 多 的 例子 . 


我 们 会 将 重点 放 在 引出 定义 和 其 解释 上 . 在 完成 


虽然 有 些 例子 有 助 于 强调 概念 , 但 


这 些 内 容 之 后 , 我 们 将 继续 考察 相 


3.1.1 ”阶乘 函数 


么 令 nl=n(n 一 1)(n 一 2):…3.2 


的 值 来 表示 序列 后 面 的 值 . 


第 一 个 要 介绍 的 定义 是 阶乘 函数 , 我 们 已 经 见 过 了 . 如 果 n 是 一 个 正 整 数 ,局 
1, 此 外 , 令 0! = 1, 这样 做 其 实 是 很 方便 的 (和 
后 详 述 ). 这 个 函数 增长 得 非常 快 : 
102500. 我 们 可 以 递归 地 定义 这 个 函数 : n! = n. (n 一 1)!, 这 意味 着 可 以 用 序列 前 面 


组 合 学 对 nl 有 一 个 很 好 的 解释 : 对 n 个 人 进行 排序 , 如 果 考 虑 先后 次 序 , 那 
么 排序 方法 的 总 数 就 是 由 这 与 我 们 之 前 看 到 的 乘法 法 则 是 一 样 的 . 想象 一 下 , 现 


关 应 用 . 


| 


10! = 3 628 800, 100! 接近 10153, 而 1000! 大 于 


在 有 5 个 人 , Bli、Cam、Matt、Kayla 和 Gabrielle, 我 们 想 看 看 这 5 个 人 排序 的 所 
有 方法 . 选择 第 一 个 人 有 5 种 方法 . 在 选 定 第 一 个 人 之 后 , 还 剩 下 4 个 人 , 所 以 选 
择 第 二 个 人 的 方法 有 4 种 . 我 们 可 能 先 选 择 了 Gabrielle, 接 下 来 第 二 个 选择 会 是 
Eli、Cam、Matt 和 Kayla 中 的 一 个 . 或 许 首先 被 选中 的 是 Cam, 这 迫使 我 们 的 第 二 
个 选择 变 成 Eli、Matt、Kayla 和 Gabrielle 中 的 一 个 . 不 管 怎样 , 第 一 个 人 有 5 种 选 
择 , 第 二 个 人 有 4 种 选择 , 第 三 个 人 有 3 种 选择 , 第 四 个 人 有 2 种 选择 , 最 后 剩 下 的 
那个 人 就 排 在 第 五 个 位 置 上 . 具体 地 说 , 假设 我 们 先 从 5 个 人 中 选 出 了 Gabrielle， 
然后 从 剩 下 的 4 个 人 (Eli、Cam、Matt 和 Kayla) 中 选 出 Cam, 此 时 还 剩 下 3 个 人 
(Eli、Matt 和 Kayla), 我 们 接 下 来 的 选择 可 能 会 是 Matt. 现在 还 剩 下 2 个 人 (Eli 
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和 Kayla), 如 果 我 们 

很 难 想象 这 5 个 人 是 怎样 
的 情况 .你 可 能 也 注意 到 了 ,| 
说 明 一 个 观 
当 的 符号 是 好 的 , 非常 好 ! 这 训 


然 , 正 是 为 了 


这 样 更 容易 到 


选择 了 Kayla, 那么 最 后 一 个 就 是 Eli. 
排列 的 , 所 以 我 们 在 图 3-1 中 详尽 地 分 析 了 三 个 人 
F 非 介 


于 名 学 的 缘故 , 讨论 的 过 程 有 点 混乱 . 但 这 六 
点 (也 是 为 了 取悦 我 的 孩子 和 我 最 年 长 的 侄女 和 侄子 ). 恰 


是 为 什么 我 们 通常 按照 字母 顺序 来 选择 名 字 ， 
E 解 ， 所 以 , 我 们 给 这 三 个 人 取 名 为 Alice、Bob、Charlie( 也 可 以 使 用 


Ariel、Belle 和 Cindy 甚至 Agamemnon、Brutus 和 Caesar). 


Bob Charlie Alice Charlie Alice Bob 


当然 , 我 们 也 可 以 不 对 所 有 人 排序 . 如 果 我 们 想 从 9 个 人 
第 二 个 人 共有 8 和 


F 列 的 方法 数 


序 , 那么 第 一 个 人 
最 后 的 第 四 个 人 共有 6 种 选 法 . 村 
种 更 具 启 发 性 的 方式 来 写 . 可 以 使 
如 果 
然 想到 找 一 种 方法 来 引入 阶乘 . 注意 , 9.8.7.6 是 一 个 阶乘 的 
上 了 一 个 写 答案 的 好 方法 


该 怎么 做 呢 ? 


5.4.3.2.1, 也 裔 


第 一 个 人 共有 3 利 


图 3-1 


三 个 人 提 


可 能 的 选 法 , 这 一 点 可 以 寿 
个 名 字 被 选中 的 概率 均 为 1/3. 虽然 第 二 个 人 
选中 的 概率 仍 是 1/3; 第 三 个 人 的 选取 也 是 一 样 的 . 这 似乎 是 合 到 
为 第 一 个 、 第 二 个 或 第 三 个 人 
一 个 、 第 二 个 或 第 三 个 人 . 


的 机 会 都 是 相 


只 有 2 种 


同 的 ， 


有 9 种 选 法 ， 


i 是 51. 这 给 


的 撤 巧 之 一 ,上 


PF 选 法 , 第 三 个 人 
就 是 9.8.7.6, 但 我 们 还 可 以 用 一 
门 


F 序 的 可 能 方法 共有 6 = 3! 种 


E 树 中 看 到 . 选择 第 一 个 人 时 ， 
可 能 的 选择 , 但 每 个 名 字 被 
的 . 每 个 人 被 选 
因此 他 们 应 该 等 可 能 地 被 选 为 第 


H 乘 以 1 的 方法 . 我 


对 所 有 人 排序 , 那么 答案 就 是 91. 看 到 这 里 出 现 了 阶乘 , 我 们 


| 


因为 


FP 选 出 4 个 人 进行 排 
有 7 种 选 法 ， 


头 部 分 . 它 缺 少 了 


3.1 阶乘 和 二 项 式 系数 83 


更 一 般 地 , 如 果 想 从 n 个 人 中 选 


不 是 n 一 k. 有 一 些 容 门 可 以 
从 9 个 人 中 选 日 


关于 


性 的 方式 来 台 


9.8.7.6.5! 9! 
9.8.7.6 = | ee 


n(nom1)(nom2)..….(n— (kom 1)) 


n(n 


— Dn—2)...(n— (ko 1)).(n— A)! 


Hk 人 进行 排序 , 那么 不 同 的 排列 方法 数 为 


nl 


(mA)! 


nk)! 


上 面 这些 是 “ 乘 以 1” 的 另 一 个 很 好 的 例子 . 这 样 我 们 就 可 以 月 


9 和 4 的 表达 式 


昌 更 简单 、 更 具 启 发 


EE 写 代数 表达 式 . 这 种 强大 的 方法 值得 我 们 花 时 间 去 丈 悉 . 


上 4 个 人 进行 排序 , 我 们 看 到 乘积 的 最 后 一 个 因 
, 那么 6 二 9 一 (4 一 1), 而 不 是 9 一 4. 你 还 会 注意 到 第 一 个 因 


对 我 来 说 , 这 种 计算 最 困难 的 部 分 就 是 准确 地 找 出 因子 , 也 就 是 说 最 终 能 写成 


什么 形式 ? 当 我 们 从 n 个 人 中 选 出 & 人 进行 排序 时 , 最 后 一 个 
保 你 不 会 犯错 误 . 一 个 守门 是 先 考察 一 种 特殊 情形 . 
子 是 6. 要 把 6 写成 


因子 是 n 一 (k 一 1)， 


子 是 9 或 者 9 一 0; 我 们 减 掉 的 值 比 当前 考察 的 次 序 少 1, 因此 最 后 被 减 挥 的 值 一 
定 包 含有 一 1, 而 不 是 (回想 一 下 生日 问题 ). 利用 你 熟悉 的 情形 去 验证 公式 肯定 是 
个 好 主意 . 


些 学 生 中 选 
少 种 选择 方法 


地 写 出 答案 这 正 是 阶乘 函数 的 优势 ! 


如 果 你 读 得 仔细 ， 


奇怪 . 


) 虽然 从 理论 上 看 计算 70! 或 40! 是 很 容易 的 , 但 这 要 进行 很 多 次 乘法 运算 . 
这 些 数 到 底 多 大 呢 ? 这 些 数 是 经 过 精心 挑选 的 , 大 部 分 计算 器 都 可 以 处 理 , 但 是 


再 举 一 个 例子 . 比如 , 威廉 姆 斯 学 院 的 高 等 数学 专业 共有 70 名 学 生 . 现在 从 这 
上 30 名 去 学 习 概率 论 课程 , 如 果 考 虑 挑选 的 先后 次 序 , 那么 一 共有 多 


3? 答案 “恰好 ”是 701/(70 一 30)! = 70!/40!. 请 注意 , 我 们 可 以 很 容易 


应 该 注意 到 “恰好 ”这 个 词 带 有 引号 . 为 什么 呢 ? 我 可 以 轻松 
地 算出 51 和 61, 但 701? (我 知道 , 用 一 个 感叹 号 和 一 个 问号 来 结束 句子 看 起 来 十 分 


大 一 点 的 数 (比如 100!) 就 可 能 导致 溢出 错误 . 对 于 取 值 较 大 的 n, 斯 特 林 公式 为 nl 


提供 了 一 个 很 好 的 估计 , 我 们 将 在 第 18 章 中 
数 大 约 是 1.46 . 1052; 确切 的 答案 是 


最 后 再 举 一 个 


展开 讨论 . 如 果 你 


感 兴趣 , 那么 方法 总 


14 681 146 334 564 331 088 939 671 869 953 268 066 486 845 440 000 000. 
认为 上 述 问 题 有 点 不 


例子 来 说 明 这 些 阶乘 有 多 么 庞大 . 你 可 能 会 
自然 : 在 威廉 姆 斯 学 院 高 等 数学 专业 的 70 名 学 生 中 , 真 的 有 30 名 学 生 想 要 上 我 的 


概率 论 课 吗 ? 如 果 是 的 话 , 谁 会 在 意 他 们 的 排列 次 序 呢 ? 


下 面 给 出 一 个 更 
的 例子 , 以 此 来 确保 所 有 人 都 能 熟悉 这 些 例子 . 在 一 副 扑 克 上牌 


种 花 ; 


自然 的 例子 . 考虑 一 副 标 准 扑克 牌 . 本 书 将 给 出 一 些 有 关 纸 牌 


色 ( 黑 桃 @、 红 村 


口 


FP, 52 张 纸牌 共有 4 


ED、 方块 ?3 和 梅花 晶 ). 每 个 花色 都 有 13 张 牌 , 编号 依次 为 


©O 
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2、3、4、5、6、7、8、9 和 10, 接 下 来 是 4 张 特殊 的 纸牌 J( 骑 士 )、Q( 皇 后 )、K( 国 


王 ) 和 A(ace 牌 ). 那么 , 对 一 副 扑 殉 牌 进行 排序 的 方法 有 
第 一 张 牧 有 52 种 选择 . 我 们 可 


共有 52! 种 , 或 者 说 


人 | 
能 会 


多 少 种 ? 


选择 黑 桃 A(A 厅 ) 或 者 方块 5(50). 一 旦 选 
定 了 第 一 张 牌 , 那么 下 一 张 牌 就 有 51 种 选择 , 依 此 类 推 . 因此 , 一 副 牌 的 排序 方法 


80 658 175 170 943 878 571 660 636 856 403 766 975 
289 505 440 883 277 824 000 000 000 000 


种 可 能 性 ! 这 是 多 大 ? 它 大 概 是 8.01 . 1057, 比 我 们 的 例子 要 大 15 个 数量 级 . 
在 黑板 上 写 一 个 像 1067 这 样 的 数 是 很 容易 的 , 但 很 难 弄 清楚 它 到 底 有 多 大 . 


所 以 , 我 们 试 着 从 另 一 个 角度 来 看 ， 粗 权 
设 每 个 人 都 可 以 一 秒 钟 济 
秒 . 一 年 大 约 有 3.2. 107 秒 ， 
情况 , 全 世界 的 人 都 将 时 间 花 在 了 洗 牌 


常 快 ! 


我 们 有 必要 停 下 来 , 思考 一 下 阶乘 函数 以 及 它 的 增长 速度 . 在 图 
绘制 了 阶乘 函数 f(n) = nl 与 平方 函数 g(n) = n? 的 对 比 图 像 . 虽然 在 刚 开始 时 平 


方 函 数 更 大 , 但 当 n = 4 时 阶乘 函数 就 变 得 更 大 ; 等 到 了 n==7 


已 经 几乎 看 不 到 了 . 
要 大 . 
如 果 仔 细 


AI 


因此 


各 地 说 ， 地球 上 


Ss Sq: 
共 需 要 


F, 而 且 在 菜 种 程度 上 , 洗 牌 


kt 有 100 亿 (1010) 人 . 假 
一 次 牌 . 那么 , 所 有 人 都 洗 完 一 次 牌 大 概 需要 8.01 . 1057 
各 近 2.6 . 1050 年 ! 记 住 , 这 是 一 种 特殊 


的 速度 真 的 非 


3-2 中 , 我 们 


蛙 近 时 , 阶乘 函数 


n 二 10 时 , 10! = 3 628 800, 这 个 值 比 102 的 36 000 倍 还 


用 , 所 以 将 它 B 


看 图 3-2, 你 可 能 会 注意 到 一 些 奇怪 的 东西 . 我 们 只 定义 了 整数 输入 
的 阶乘 函数 , 但 是 绘制 了 从 1 到 10 的 所 有 实 值 输入 的 图 像 . 这 是 怎么 回 事 ? 现在 
希望 你 确信 阶乘 函数 是 有 用 的 . 阶乘 函数 非常 有 
是 让 人 倍 感 遗 憾 的 错误 . 数学 家 们 (以 及 统计 学 家 、 物理 学 家 、] 
发 现 把 阶乘 函数 扩展 到 全 体 实数 (甚至 是 复数 ! ) 是 非常 有 用 的 . 我 们 把 这 个 扩展 


民 制 为 整数 输入 其 实 
[ 程 师 .……: ) 已 经 


称 为 伽 马 函数 ; 对 于 所 有 的 非 负 整 数 n, F(n) = (n 一 1)!. 在 第 15 章 中 , 我 们 会 花 大 


量 时 间 来 解释 这 个 函数 , 甚至 解释 为 什么 这 种 讨厌 的 转化 是 很 “ 自 


然 的 ”. (如 果 你 


想 推广 阶乘 函数 , 那么 是 不 是 希望 f(n) = nl, 而 不 是 (mn 一 1)1? ) 好 吧 , 虽然 在 句 尾 


有 一 个 右 括号 , 但 我 们 和 有 
和 问号 一 一 这 就 是 研究 阶乘 外 
本 贡 的 最 后 给 出 阶乘 函数 的 定义 和 解释 . 


实 以 正确 的 语法 结束 了 最 后 
得 到 的 好 处 之 一 . 


人 句 , 这 日 


再 次 使 用 了 感叹 号 


的 方法 只 有 一 种 . 


阶乘 函数 : 如 果 n 是 一 个 正 整 数 , 那么 nl = 二 n(n 一 1)…1 
nl 解释 为 n 人 排序 的 方法 数 ; 如 果 n 等 于 0, 那么 就 把 它 解释 为 “什么 都 不 做 ” 


? 


首 且 0! 


二 1. 我 们 把 
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图 3-2 ”阶乘 函数 与 平方 函数 的 对 比 图 像 . 留意 阶乘 函数 增长 的 速度 有 多 快 . 当 n 小 于 3.56 
时 , 平方 函数 更 大 ; 但 是 , 一 旦 n 超过 了 3.56, 阶乘 函数 就 比 平方 函数 大 得 多 . 当 
n 二 6 时 , 6!= 720, 而 62 = 36; 当 n = 二 7 时 差异 更 明显 , 7! 等 于 5040, 但 72 = 49 


3.1.2 ”二 项 式 系数 


阶乘 函数 常用 在 需要 考虑 次 序 的 问题 中 , 但 是 , 很 多 时 候 次 序 并 不 重要 . 例如 ， 
想象 一 下 , 我 们 回 到 了 小 学 操场 上 , 正在 为 足球 队 挑 选 小 队员 . 不 久 后 , 每 个 人 都 被 
分 配 到 了 两 个 球 队 中 的 一 个 . 你 是 第 几 个 进入 球 队 的 并 不 重要 , 重要 的 是 你 属于 哪 
个 队 . 也 可 以 考虑 一 场 扑 克 牌 游戏 . 你 有 5 张 牌 : 得 到 这 些 牌 的 次 序 并 不 重要 , 重 
要 的 是 这 5 张 牌 都 是 什么 . 

我 们 来 更 仔细 地 看 看 最 后 这 个 问题 . 如 果 我 们 想 知道 从 52 张 牌 中 拿 到 5 张 牌 
一 共有 多 少 种 方法 , 那么 答案 就 是 


521/(52 — 5)! = 521/47! = 52 .51.50.49.48， 


也 就 是 311 875 200. 假设 我 们 (依次 ) 拿 到 了 5®%、60、79、7@ 和 J 多. 接 下 来 又 依 
次 拿 到 J 唤 、5 向 、7 和 、6 人 和 和 79, 尽管 这 与 第 一 次 取 牌 的 方式 不 同 , 但 我 们 两 次 拿 到 
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的 牌 是 相同 的 5 张 . 需要 考虑 这 样 一 个 事实 : 可 以 采用 不 同 的 方法 来 拿 到 同样 的 5 
张 牌 . 

每 次 遇 到 问题 , 你 都 应 该 试 着 找 一 下 答案 . 当 考 虑 先后 次 序 时 , 从 52 张 牌 中 选 
上 5 张 牌 一 共有 52!/47! 种 方法 . 现在 我 们 不 再 考虑 次 序 . 因此 , 不 管 答案 是 什么 ， 
它 一 定 小 于 52!/47!. 那么 小 了 多 少 呢 ? 这 就 是 我 们 要 考虑 的 问题 . 最 重要 的 是 我 们 
拿 到 的 是 哪 5 张 牌 , 而 不 是 拿 牌 的 次 序 是 怎样 的 . 对 5 张 牌 进行 排 闻 的 方法 一 共有 
多 少 种 ? 这 很 简单 依次 排列 5 张 牌 的 方法 共有 5! 种 . 考察 这 个 问题 的 另 一 种 
方式 为 , 这 5 张 牌 构成 的 有 序 集 共 有 5! 个 . 所 有 这 些 排序 都 是 用 相同 的 5 张 牌 生 
成 的 , 只 是 顺序 不 同 而 已 . 因此 , 我 们 必须 让 521/47! 除 以 51. 这 样 就 得 到 了 在 不 考 
虑 次 序 的 前 提 下 , 从 52 张 牌 中 选 出 5 张 牌 一 共有 

521/47! 52! 


加 587 598 960 


种 方法 . 我 们 已 经 把 可 能 的 方法 数 从 约 3.11 亿 减 少 到 了 250 多 万 . 与 预期 的 一 样 ， 
不 考虑 次 序 时 , 可 能 性 就 少 了 很 多 . 
我 们 再 举 一 个 例子 来 看 看 发 生 了 什么 . 我 们 使 用 恰当 的 符号 , 并 假设 现在 有 5 
个 人 : Alice、Bob 、Charlie、Dan 和 Eve. 在 不 考虑 次 序 的 前 提 下 , 从 中 选 出 3 个 人 
共有 多 少 种 方法 ? 
对 这 5 个 人 进行 排序 , 一 共有 5! 也 就 是 120 种 方 ; 


{Alice, Bob, Charlie, Dan, Eve} {Alice, Bob, Charlie, Eve, Dan} {Alice, Bob, Dan, Charlie, Eve} 
{Alice, Bob, Dan, Eve, Charlie} {Alice, Bob, Eve, Charlie, Dan} {Alice, Bob, Eve, Dan, Charlie} 
{Alice, Charlie, Bob, Dan, Eve} {Alice, Charlie, Bob, Eve, Dan} {Alice, Charlie, Dan, Bob, Eve} 
{Alice, Charlie, Dan, Eve, Bob} {Alice, Charlie, Eve, Bob, Dan} {Alice, Charlie, Eve, Dan, Bob} 
{Alice, Dan, Bob, Charlie, Eve} {Alice, Dan, Bob, Eve, Charlie} {Alice, Dan, Charlie, Bob, Eve} 
{Alice, Dan, Charlie, Eve, Bob} {Alice, Dan, Eve, Bob, Charlie} {Alice, Dan, Eve, Charlie, Bob} 
{Alice, Eve, Bob, Charlie, Dan} {Alice, Eve, Bob, Dan, Charlie} {Alice, Eve, Charlie, Bob, Dan} 
{Alice, Eve, Charlie, Dan, Bob} {Alice, Eve, Dan, Bob, Charlie} {Alice, Eve, Dan, Charlie, Bob} 
{Bob, Alice, Charlie, Dan, Eve} {Bob, Alice, Charlie, Eve, Dan} {Bob, Alice, Dan, Charlie, Eve} 
{Bob, Alice, Dan, Eve, Charlie} {Bob, Alice, Eve, Charlie, Dan} {Bob, Alice, Eve, Dan, Charlie} 
{Bob, Charlie, Alice, Dan, Eve} {Bob, Charlie, Alice, Eve, Dan} {Bob, Charlie, Dan, Alice, Eve} 
{Bob, Charlie, Dan, Eve, Alice} {Bob, Charlie, Eve, Alice, Dan} {Bob, Charlie, Eve, Dan, Alice} 
{Bob, Dan, Alice, Charlie, Eve} {Bob, Dan, Alice, Eve, Charlie} {Bob, Dan, Charlie, Alice, Eve} 
{Bob, Dan, Charlie, Eve, Alice} {Bob, Dan, Eve, Alice, Charlie} {Bob, Dan, Eve, Charlie, Alice} 
{Bob, Eve, Alice, Charlie, Dan} {Bob, Eve, Alice, Dan, Charlie} {Bob, Eve, Charlie, Alice, Dan} 
{Bob, Eve, Charlie, Dan, Alice} {Bob, Eve, Dan, Alice, Charlie} {Bob, Eve, Dan, Charlie, Alice} 
{Charlie, Alice, Bob, Dan, Eve} {Charlie, Alice, Bob, Eve, Dan} {Charlie, Alice, Dan, Bob, Eve} 
{Charlie, Alice, Dan, Eve, Bob} {Charlie, Alice, Eve, Bob, Dan} {Charlie, Alice, Eve, Dan, Bob} 
{Charlie, Bob, Alice, Dan, Eve} {Charlie, Bob, Alice, Eve, Dan} {Charlie, Bob, Dan, Alice, Eve} 
{Charlie, Bob, Dan, Eve, Alice} {Charlie, Bob, Eve, Alice, Dan} {Charlie, Bob, Eve, Dan, Alice} 
{Charlie, Dan, Alice, Bob, Eve} {Charlie, Dan, Alice, Eve, Bob} {Charlie, Dan, Bob, Alice, Eve} 
{Charlie, Dan, Bob, Eve, Alice} {Charlie, Dan, Eve, Alice, Bob} {Charlie, Dan, Eve, Bob, Alice} 


EE 


具体 情况 如 下 : 


BE 
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{Charlie, Eve, Alice, Bob, Dan} {Charlie, Eve, Alice, Dan, Bob} {Charlie, Eve, Bob, Alice, Dan} 
{Charlie, Eve, Bob, Dan, Alice} {Charlie, Eve, Dan, Alice, Bob} {Charlie, Eve, Dan, Bob, Alice} 
{Dan, Alice, Bob, Charlie, Eve} {Dan, Alice, Bob, Eve, Charlie} {Dan, Alice, Charlie, Bob, Eve} 
{Dan, Alice, Charlie, Eve, Bob} {Dan, Alice, Eve, Bob, Charlie} {Dan, Alice, Eve, Charlie, Bob} 
{Dan, Bob, Alice, Charlie, Eve} {Dan, Bob, Alice, Eve, Charlie} {Dan, Bob, Charlie, Alice, Eve} 
{Dan, Bob, Charlie, Eve, Alice} {Dan, Bob, Eve, Alice, Charlie} {Dan, Bob, Eve, Charlie, Alice} 
{Dan, Charlie, Alice, Bob, Eve} {Dan, Charlie, Alice, Eve, Bob} {Dan, Charlie, Bob, Alice, Eve} 
{Dan, Charlie, Bob, Eve, Alice} {Dan, Charlie, Eve, Alice, Bob} {Dan, Charlie, Eve, Bob, Alice} 
{Dan, Eve, Alice, Bob, Charlie} {Dan, Eve, Alice, Charlie, Bob} {Dan, Eve, Bob, Alice, Charlie} 
{Dan, Eve, Bob, Charlie, Alice} {Dan, Eve, Charlie, Alice, Bob} {Dan, Eve, Charlie, Bob, Alice} 
{Eve, Alice, Bob, Charlie, Dan} {Eve, Alice, Bob, Dan, Charlie} {Eve, Alice, Charlie, Bob, Dan} 
{Eve, Alice, Charlie, Dan, Bob} {Eve, Alice, Dan, Bob, Charlie} {Eve, Alice, Dan, Charlie, Bob} 
{Eve, Bob, Alice, Charlie, Dan} {Eve, Bob, Alice, Dan, Charlie} {Eve, Bob, Charlie, Alice, Dan} 
{Eve, Bob, Charlie, Dan, Alice} {Eve, Bob, Dan, Alice, Charlie} {Eve, Bob, Dan, Charlie, Alice} 
{Eve, Charlie, Alice, Bob, Dan} {Eve, Charlie, Alice, Dan, Bob} {Eve, Charlie, Bob, Alice, Dan} 
{Eve, Charlie, Bob, Dan, Alice} {Eve, Charlie, Dan, Alice, Bob} {Eve, Charlie, Dan, Bob, Alice} 
{Eve, Dan, Alice, Bob, Charlie} {Eve, Dan, Alice, Charlie, Bob} {Eve, Dan, Bob, Alice, Charlie} 
{Eve, Dan, Bob, Charlie, Alice} {Eve, Dan, Charlie, Alice, Bob} {Eve, Dan, Charlie, Bob, Alice} 


记 住 , 想 想 我 们 是 如 何 列 出 它们 的 . 非常 重要 的 一 点 就 是 不 能 遗漏 任何 项 , 因 

此 我 们 需要 一 种 好 的 、 系 统 的 方法 来 列 出 所 有 可 能 
在 这 个 问题 中 , 我 们 考察 的 不 是 5 个 人 , 而 是 3 个 人 . 没 错 , 我 们 要 做 的 就 是 
忽略 上 面 每 个 选择 中 的 最 后 2 个 人 . 那么 剩 下 的 就 是 从 5 人 中 选 出 3 人 进行 排序 
的 全 部 60 种 方法 , 这 比 同时 考察 5 个 人 更 容易 操作 ( 即 51/(5 一 3)! = 5!/2! = 60). 
注意 60 等 于 120/2!. 实际 上 , 这 包含 了 很 多 意思 . 你 可 以 说 , 一 旦 选 定 了 前 3 个 人 ， 
那么 把 它 补充 成 5 个 人 的 排列 一 共有 2! 种 方法 . 这 是 因为 最 后 2 个 位 置 共 有 2! 种 
选择 (有 序 计 数 ). 在 下 个 阶段 , 我 们 会 重新 讨论 这 一 观点 . 
{Alice, Bob, Charlie} {Alice, Bob, Dan} {Alice, Bob, Eve} 


{Alice, Charlie, Dan} {Alice, Charlie, Eve} {Alice, Dan, Bob} 
{Alice, Dan, Eve} {Alice, Eve, Bob} {Alice, Eve, Charlie} 


{Alice, Charlie, Bob} 
{Alice, Dan, Charlie} 
{Alice, Eve, Dan} 


{Bob, Alice, Charlie} 


{Bob, Charlie, Dan} 
{Bob, Dan, Eve} 


{Charlie, Alice, Bob} 


{Charlie, Bob, Dan} 
{Charlie, Dan, Eve} 
{Dan, Alice, Bob} 

{Dan, Bob, Charlie} 
{Dan, Charlie, Eve} 
{Eve, Alice, Bob} 

{Eve, Bob, Charlie} 
{Eve, Charlie, Dan} 


{Bob, Alice, Dan} 


{Bob, Charlie, Eve} 
{Bob, Eve, Alice} 
{Charlie, Alice, Dan} 
{Charlie, Bob, Eve} 
{Charlie, Eve, Alice} 
{Dan, Alice, Charlie} 
{Dan, Bob, Eve} 
{Dan, Eve, Alice} 
{Eve, Alice, Charlie} 
{Eve, Bob, Dan} 
{Eve, Dan, Alice} 


{Bob, Alice, Eve} 
{Bob, Dan, Alice} 
{Bob, Eve, Charlie} 
{Charlie, Alice, Eve} 
{Charlie, Dan, Alice} 
{Charlie, Eve, Bob} 
{Dan, Alice, Eve} 
{Dan, Charlie, Alice} 
{Dan, Eve, Bob} 
{Eve, Alice, Dan} 
{Eve, Charlie, Alice} 
{Eve, Dan, Bob} 


{Bob, Charlie, Alice} 
{Bob, Dan, Charlie} 
{Bob, Eve, Dan} 
{Charlie, Bob, Alice} 
{Charlie, Dan, Bob} 
{Charlie, Eve, Dan} 
{Dan, Bob, Alice} 
{Dan, Charlie, Bob} 
{Dan, Eve, Charlie} 
{Eve, Bob, Alice} 
{Eve, Charlie, Bob} 
{Eve, Dan, Charlie} 
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我 们 把 列表 中 的 所 有 Alice、Bob 和 Charlie 都 加 粗 . 


{Alice, Bob, Charlie} {Alice, Bob, Dan} {Alice, Bob, Eve} {Alice, Charlie, Bob} 
{Alice, Charlie, Dan} {Alice, Charlie, Eve} {Alice, Dan, Bob} {Alice, Dan, Charlie} 
{Alice, Dan, Eve} {Alice, Eve, Bob} {Alice, Eve, Charlie} {Alice, Eve, Dan} 
{Bob, Alice, Charlie} {Bob, Alice, Dan} {Bob, Alice, Eve} {Bob, Charlie, Alice} 
{Bob, Charlie, Dan} {Bob, Charlie, Eve} {Bob, Dan, Alice} {Bob, Dan, Charlie} 
{Bob, Dan, Eve} {Bob, Eve, Alice} {Bob, Eve, Charlie} {Bob, Eve, Dan} 
{Charlie, Alice, Bob} {Charlie, Alice, Dan} {Charlie, Alice, Eve} {Charlie, Bob, Alice} 
{Charlie, Bob, Dan} {Charlie, Bob, Eve} {Charlie, Dan, Alice} {Charlie, Dan, Bob} 
{Charlie, Dan, Eve} {Charlie, Eve, Alice} {Charlie, Eve, Bob} {Charlie, Eve, Dan} 
{Dan, Alice, Bob} {Dan, Alice, Charlie} {Dan, Alice, Eve} {Dan, Bob, Alice} 
{Dan, Bob, Charlie} {Dan, Bob, Eve} {Dan, Charlie, Alice} {Dan, Charlie, Bob} 
{Dan, Charlie, Eve} {Dan, Eve, Alice} {Dan, Eve, Bob} {Dan, Eve, Charlie} 
{Eve, Alice, Bob} {Eve, Alice, Charlie} {Eve, Alice, Dan} {Eve, Bob, Alice} 

{Eve, Bob, Charlie} {Eve, Bob, Dan} {Eve, Charlie, Alice} {Eve, Charlie, Bob} 
{Eve, Charlie, Dan} {Eve, Dan, Alice} {Eve, Dan, Bob} {Eve, Dan, Charlie} 


注意 , 在 上 面 的 60 个 集合 中 , 有 6 个 集合 包含 了 相同 的 3 个 人 (Alice、Bob 和 
Charlie). 这 6 个 集合 的 唯一 区 别 就 是 3 个 人 的 排列 次 序 不 同 ; 但 是 , 如 果 不 考虑 次 
序 , 这 6 个 集合 会 产生 同一 个 无 序 集 . 这 个 无 序 集 可 以 写成 {Alice, Bob, Charlie}; 
当然 , 也 可 以 写成 这 6 种 排列 中 的 其 他 任何 一 种 . 

关键 的 一 点 是 , 上 面 的 6 并 不 只 是 个 普通 数字 . 你 应 该 把 它 看 成 3 这 是 3 个 
人 排序 的 方法 数 . 我 们 要 做 的 就 是 删 掉 次 序 . 从 本 质 上 讲 , 我 们 正在 分 解 东西 . 在 计 
数 时 , 我 们 认为 这 6 种 排序 是 一 样 的 . 虽然 强调 了 Alice、Bob 和 Charlie, 但 他 们 的 
名 字 并 没什么 特别 之 处 . 同样 的 逻辑 也 适用 于 Alice、Dan 和 Eve, 或 者 更 一 般 地 适 
用 于 任意 3 个 名 字 . 
现在 , 我 们 能 够 给 出 最 终 的 答案 了 . 我 们 想 知道 在 不 考虑 次 序 的 前 提 下 , 从 5 
个 人 中 选 出 3 人 一 共有 多 少 种 方法 . 当 考 虑 次 序 时 , 一 共有 5!/(5 - 3)! 种 方法 . 接 
下 来 , 通过 除 以 31, 我 们 “ 删 掉 ” 了 次 序 , 于 是 最 终 的 答案 就 是 51/3!1(5 一 3)!, 或 者 
5!/3!2! 也 就 是 10. 下 面 是 我 们 的 最 终 列表 , 从 5 人 中 选 出 3 人 的 10 个 不 同 的 集 


人. 
[me 


{Alice, Bob, Charlie} {Alice, Bob, Dan} {Alice, Bob, Eve} {Alice, Charlie, Dan} 
{Alice, Charlie, Eve} {Alice, Dan, Eve} {Bob, Charlie, Dan} {Bob, Charlie, Eve} 
{Bob, Dan, Eve} {Charlie, Dan, Eve} 


我 们 有 必要 思考 一 下 如 何 给 出 这 个 列表 . 方法 有 很 多 种 , 但 我 们 要 确保 不 会 遗 
漏 任 何 项 . 一 种 简单 的 方法 是 先 考 察 所 有 包含 Alice 和 Bob 的 集合 , 这 样 的 集合 


有 三 个 . 在 此 之 后 , 看 看 所 有 包含 Alice 和 Charlie 的 集合 , 于 是 又 得 到 了 两 个 新 集 
合 . 接 下 来 考察 同时 包含 Alice 和 Dan 的 集合 , 我 们 又 找到 一 个 新 集合 . 包含 Alice 
和 Eve 的 所 有 集合 都 已 经 出 现 过 了 , 所 以 我 们 继续 寻找 包含 Bob 和 Charlie 的 集 


3.1 阶乘 和 二 项 式 系 数 89 


合 . 之 前 已 经 找到 了 一 个 同时 包含 Alice、Bob 和 Charlie 的 集合 , 现在 我 们 又 发 现 
了 两 个 新 集合 ; 除了 Bob 和 Charlie 之 外 , 这 两 个 新 集合 还 分 别 包含 Dan 和 Eve. 
我 们 继续 考察 包含 Bob 和 Dan 的 三 元 组 , 又 找 出 了 另 一 个 新 集合 . 最 后 考察 包含 
Charlie 和 Dan 的 集合 (不 需要 继续 考察 包含 Charlie 和 Eve 的 集合 , 以 及 包含 Dan 
和 Eve 的 集合 , 因为 我 们 已 经 把 所 有 情况 都 考虑 过 了 ). 

尽管 我 竭尽 所 能 去 写 一 本 好 的 、 实 用 的 书 , 但 是 没有 足够 的 耐心 把 本 节 的 所 有 
列表 都 写 出 来 ! 我 也 不 应 该 做 这 些 一 一 这 是 电脑 的 理想 任务 . 你 能 使 用 的 程序 非 
常 多 . 我 是 Mathematica 和 WolframAlpha 的 忠实 粉丝 , 这 些 列表 是 通过 下 列 输入 
得 到 的 . 
Permutations [{Alice, Bob, Charlie, Dan, Eve}] 
Permutations[{Alice, Bob, Charlie, Dan, Eve}, {3}] 
( 接 下 来 , 我 必须 清理 空格 , 并 把 格式 设置 得 更 好 些 , 但 查找 和 蔡 换 的 工作 很 快 就 能 
完成 .) 我 鼓励 你 使 用 电脑 来 研究 各 类 主题 , 解决 一 些 问题 , 弄 清楚 事情 是 什么 样 的 . 

既然 我 们 已 经 详细 地 分 析 了 问题 , 现在 是 时 候 进 行 概括 了 . 从 n 个 人 中 选 出 
人 一 共有 nl/(k!(n 一 )!) 种 方法 . 在 整个 课程 (以 及 后 续 课 程 ) 中 , 我 们 会 不 断 地 看 
到 这 个 表达 式 , 所 以 它 应 该 有 自己 的 名 字 (就 像 阶乘 函数 有 自己 名 字 那 样 ). 我 们 把 
它 称 为 二 项 式 系数 , 并 记 作 (中 . n 和 上 都 是 非 负 整 数 , 并 且 大 < n; 如 果 大 > ns 那 
么 设 (") = 0. 这 种 做 法 是 合理 的 . 我 们 需要 一 种 定义 0! 的 方法 , 有 很 好 的 理由 让 
它 等 于 1( 要 么 把 它 看 作 一 个 空 积 , 要 么 认为 “什么 都 不 做 ”的 方法 只 有 1 种 )， (3 
有 什么 涵义 ? 它 指 的 是 在 不 考虑 次 序 的 前 提 下 , 从 4 个 物体 中 选 出 5 个 一 共有 多 少 
种 方法 . 我 们 根本 无 法 做 到 这 一 点 , 因此 把 它 设置 为 0 是 合理 的 . 

在 上 文中 , 我 们 讨论 了 (各 应 该 等 于 0， 那 么 (4) 是 多 少 , 或 者 更 一 般 地 , 当 
取 负 整数 时 ( 应 该 是 多 少 ? 把 阶乘 函数 进一步 推广 可 以 得 到 伽 马 函 数 , 其 定义 
为 : 当 s 的 实 部 大 于 -1 时 , 有 


TI(s) = | e725 1dx. 
0 


只 要 n 为 非 负 整数 , 那么 利用 分 布 积分 法 就 能 得 到 FT(n + 1) = nl. 还 有 更 多 关于 伽 
马 函数 的 结论 , 比如 T(s +1) = sT(s), 这 回答 了 如 何 将 二 项 式 系数 推广 到 负 值 . 我 
们 将 在 第 15 章 中 看 到 伽 马 函数 

上 面 的 方法 非常 强大 , 我 常 称 它 为 故事 证 明 法 (Proof by Story). 另 一 个 例子 请 
参阅 A.6 节 , 我 们 会 证 明 一 个 非常 重要 的 二 项 恒等式 : (四 + (,") = (+!). 这 是 
帕斯卡 三 角形 的 基础 , 而 帕斯卡 三 角形 给 出 了 二 项 式 定理 (相关 陈述 与 证 明 请 参阅 
A.2.3 节 和 A.6 节 ). 稍 后 我 们 会 用 到 这 个 非常 重要 的 事实 
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3.1.3 ”总 结 


F 面 快速 回顾 一 下 我 们 都 做 了 什么 . 我们 刚刚 介绍 了 组 合 学 和 概率 学 中 最 重 
要 的 两 个 函数 . 当 你 学 习 了 更 高 等 的 知识 后 , 重新 审视 之 前 的 概念 是 个 不 错 的 主意 ， 
因为 可 以 把 事情 看 得 更 清楚 、 理 解 得 更 透彻 . 
如 果 有 一 个 集合 , 那么 我 们 可 以 问 两 个 很 自然 的 问题 

。 对 集合 中 的 元 素 进行 排序 , 一 共有 多 少 种 方法 ? 

。 在 不 考虑 次 序 的 前 提 下 ， 从 中 挑选 出 若干 元 素 , 一 共有 多 少 种 方法 ? 

第 一 个 问题 称 为 排列 , 其 解决 方案 涉及 阶乘 函数 . 第 二 个 问题 称 为 组 合 , 由 它 
可 以 导出 三 项 式 系数 . 如 果 有 7 个 物体 ， 过 生体 站 人 略 办 这 让 nl 
种 ; 同样 可 以 说 , 存在 nl 个 排列 , 或 者 排列 它们 的 方法 有 nl 种 . 排列 在 许多 数学 领 
域 中 发 挥 着 重要 作用 , 在 群 论 中 尤为 重要 . 
概率 分 配 中 最 常见 的 一 个 错误 必定 是 混淆 了 排列 和 组 合 . 总 是 记得 问 问 自己 : 

要 考虑 次 序 吗 ? 如 果 需 要 , 那 就 考虑 排列 和 阶乘 ， 和 否则 ,就 考虑 组 合 与 二 项 式 
关于 组 合 , 有 一 个 很 重要 的 事实 : (”) = (,”,). 我 们 会 在 A.6 节 中 给 出 相关 
证 明 . 但 它 的 证 明 会 用 到 一 个 非常 重要 的 结果 , 因此 我 们 在 这 里 说 一 下 .当然 , 证 
明 这 一 点 有 个 显而易见 的 方法 , 就 是 写 出 这 两 个 表达 式 , 并 说 明 它 们 是 相等 的 . 我 
们 有 


() nl ( n ) 加 nl a nl 
Ek) Rn 一 有 nk (一 AI 一 (一 1 (一 AD 
因为 分 母 上 的 乘法 因子 是 可 以 交换 的 , 所 以 这 两 个 式 子 显然 相等 . 在 这 里 , 最 关键 
的 一 点 就 是 =n 一 (n 一 有 ). 由 于 表达 式 里 有 一 个 (n 一 )!, 因此 做 这 样 的 尝试 是 
很 自然 的 当然 , 解决 这 个 问题 的 另 一 各 思路 是 把 (") 和 (,”,) 具体 写 出 来 . 此 时 ， 
在 第 二 个 式 子 中 会 出 现 n 一 (n - 外 也 就 是 有 这 样 就 得 出 了 两 个 式 子 相等 

现在 , 我 们 证 明了 (") = ( ” ), 但 我 并 不 觉得 这 种 方法 特别 有 启发 性 在 我 看 
来, 下 面 的 方法 更 好 . (") 有 什么 含义 ? 它 指 的 是 在 不 考虑 次 序 的 前 提 下 , 从 丸 个 人 
中 挑选 出 大 个 人 的 方法 数 . 假设 有 大 张 芬 威 公园 开放 日 的 门票 , 但 一 共有 n 个 人 
想 去 . 从 中 选 出 人 前 往 的 方法 共有 (") 种 . 然而 , 选 出 上 人 前 往 也 可 以 看 作 选 出 
n 一个 人 不 去 , 那么 选 出 nk 个 人 共有 多 少 种 方法 ? 恰好 是 (,",) 种 方法 . 瞧 
这 两 个 结果 肯定 是 相等 的 ! 从 n 个 人 中 选 出 人 与 从 nn 个 人 中 选 出 mn 一 人 是 一 
样 的 ! 这 是 故事 证 明 的 另 一 个 例子 . 


3.2 扑克 上 牌 
很 难 想象 一 个 学 习 概 率 论 的 班级 在 整个 学 期 里 都 不 参与 一 场 博弈 游戏 . 


= 
中 
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上 , 我 兽 遇 到 这 样 一 个 学 生 , 他 没有 任何 概率 论 的 预备 知识 , 但 仍然 非常 积极 地 想 


参加 我 的 概率 论 课 . 他 是 个 狂热 的 扑克 牌 玩家 , 希望 能 在 下 注 时 做 得 更 好 . 在 他 看 
来 , 概率 论 的 应 用 会 从 扑克 牌 开 始 . 我 们 讲 了 很 多 例子 . 你 没有 必要 把 所 有 的 例子 


都 看 一 遍 , 我 鼓励 你 去 看 其 中 几 个 例子 , 然后 试 着 自己 独立 解决 其 他 问题 , 最 后 再 


与 本 书 的 内 容 进行 比较 . 你 也 可 以 写 一 些 代码 , 从 数值 角度 来 研究 概率 . 好 的 编码 


技巧 可 以 极 大 地 简化 某 些 问题 的 求解 过 程 , 之 后 我 们 将 详细 讨论 这 些 问题 . 


3.2.1 规则 


扑克 牌 有 很 多 不 同 的 玩法 . 我 们 将 概述 主要 的 规则 , 想 了 解 更 多 内 容 , 请 参阅 


维基 百科 的 相关 页 面 . 大 多 数 玩法 使 有 


红 桃 、 方 块 和 梅花 ) 各 有 13 张 , 编号 依次 为 2 到 10, 然后 是 J、Q、K 和 A. 通常 情 


的 是 标准 的 52 张 牌 . 4 种 花色 的 牌 ( 黑 桃 、 


况 下 , 玩家 会 拿 到 5 张 牌 , 有 时 会 允许 玩家 换 牌 , 但 有 时 不 允许 ; 手气 最 好 的 人 获 


胜 (但 有 些 游戏 会 把 一 部 分 钱 分 给 那些 
搭 牌 ”, 可 以 当 作 任何 一 张 牌 使 用 , 这 样 你 就 有 可 能 得 到 5 张 点 数 相同 的 牌 . 在 图 


3-3 中 我 们 展示 了 标准 的 扑克 牌 型 . 


g 手 气 最 差 的 人 ). 有 时 候 , 某 些 牌 会 充当 “ 百 
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图 3-3 标准 的 扑克 牌 型 . 图 片 


来 自 维 基 共 享 资源 , 由 Sissyneck 上 传 


希望 图 3-3 能 清晰 地 展现 各 种 牌 型 . 实际 上 , 我 们 没有 给 出 最 小 牌 型 , 因为 它 


没什么 特别 之 处 ! 第 一 种 有 趣 的 牌 型 是 对 子 , 也 就 是 两 张 牌 的 点 数 恰 好 相同 . 在 图 
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3-3 中 , 对 子 的 点 数 


四 
人 丰 


是 5. 如 


晶 


最 大 牌 来 决定 . 


于 这 是 


本 数 


可 以 去 查阅 


他 资料 ， 以 有 


有 定 


当 两 个 或 更 多 人 有 相同 


两 个 人 恰好 有 相同 的 对 子 , 那么 他 们 的 胜 
学 书 , 而 不 是 打 扑克 的 指南 ， 


里 ; 你 
决胜 关键 是 什么 ). 


负 由 剩 下 的 


因此 我 们 就 介绍 到 这 
站 型 时 会 发 生 什 么 ( 即 


接 下 来 较 大 的 牌 型 是 两 对 (图 中 给 出 的 是 一 对 10 和 一 对 2), 然后 是 三 条 (这 里 


有 3 张 9). 在 此 之 后 , 我 们 给 出 了 一 个 


连 号 牌 . 
因此 ， 


它 1 


门 的 花 : 


比 顺 子 更 大 的 


下 


最 


垢 )， 


大 的 牌 型 是 同花顺 . 
好 了 . 如 果 你 以 前 没 见 过 扑 殉 牌 , 现在 至 少 对 它 有 了 大 致 的 了 解 . 习 


色 不 一 定 相 同 , 其 中 A 牌 可 以 被 当 作 小 敌 
顺 子 既 包括 A&、29、39 、40 和 5®%, 也 包括 10 刘 、J 施 、QO 、KS 


人 


新 的 牌 型 : 顺 子 . 顺 子 是 依次 递增 


| 


, 也 可 以 被 当 


的 5 张 


人 大牌. 
和 A®. 


香 型 是 同 花 , 即 5 张 花色 相同 的 牌 . 下 一 种 更 大 的 牌 
由 3 张 点 数 相同 的 牌 和 一 个 对 子 组 成 . 比 戎 芦 大 的 牌 型 是 铁 支 (有 4 张 点 数 相同 日 


日 二 


征明 户 ， 
日 


型 


下 


下 , 牌 


型 的 次 序 (从 小 到 大 ) 依次 为 : 对 子 、 两 对 、 三 条 、 顺 子 、 同 花 、 萌 疡 、 铁 文 和 同 花 


顺 . 这 自 


A 


和 


玫 


想 了 解 昌 


一 个 问题 是 : 


多 相关 内 容 , 可 以 查阅 


然 引 出 了 两 个 问题 . 
为 什么 是 这 些 牌 型 ? 简单 地 
在 逃避 问题 , 孩子 们 会 继续 追问 的 ， 答 甸 
发 现 这 样 很 有 趣 ; 标准 


化 有 很 多 的 优点 ; 


唱 


答 : 为 什么 不 是 呢 ! 好 


吧 , 这 是 
| 用 


可 能 
等 等 ,这 个 问题 超 | 


多 


ba 


佳 基 百科 , 看 看 为 


小 到 大 , 我 们 一 直 都 在 玩 “ 


我 们 可 以 验 记 


第 二 个 问题 在 我 们 的 下 
候 展现 我 们 的 能 力 了 . 如 果 牌 型 次 
F 这 一 点 , 但 
张 , 我 们 可 以 算 一 下 拿 到 任意 一 种 牌 型 的 概率 . 六 
概率 是 不 一 样 的 ( 寿 


间隔 顺 


究 范 


[SA 


2 
二 


内 : 


民 多 : 人 们 玩 了 很 多 稀 
Hh 了 本 书 的 范 
了 些 非 标准 的 牌 型 是 什么 样 的 (从 


FE 扑克 


牌 ,他们 
天. 如 果 


内 


. 作为 数学 家 , 我 们 将 接受 这 
小 型 的 次 


py 


需要 花费 一 


"AE 


EF 


段 H 


给 
这 为 什么 是 这 样 的 ? 啊 , 现在 是 时 
恰当 的 , 那么 牌 型 越 大 , 其 个 数 就 应 该 越 少 . 


对 间 . 不 过 , 假如 随机 地 给 


E 玩 牌 时 , 可 能 会 


H 52 张 牌 中 
FE 意 , 这 与 玩 牌 时 拿 到 每 和 


ws 


| 


搭 丑 


牌 ). 这 都 不 是 问题 


题 也 能 帮助 你 更 好 
在 计算 每 一 种 牌 型 


关键 是 要 天 


也 掌握 概率 知识 . 
的 


序 地 挑 出 5 张 牌 的 方法 数 ， 

250 多 万 种 可 能 的 取 法 ! 只 要 有 可 能 ， 
部 分 原因 是 , 有 些 人 会 更 人 

而 , 主要 的 原因 是 这 样 能 够 

个 答案 , 那么 我 们 对 答案 就 更 有 信心 
道 一 定 出 现 了 错误 

最 
出 错误 的 答案 一 希望 我 的 学 生 能 


我 们 就 会 尝试 采用 多 利 


ij 爱 某 种 方法 , 所 以 我 们 最 好 把 所 有 方法 都 


, 你 手 里 可 能 有 7 张 导 
明白 如 何 计 算 . 即使 你 对 扑克 牌 不 感 兴趣 , 这 些 问 


内 


定 牌 型 . 


的 5 
F 牌 型 的 
,也许 你 能 换 


用 率 时 ,我 们 都 要 除 上 一 个 数 , 它 就 是 从 52 张 牌 中 无 次 
即 ( 吕 ) = 521/(5147!), 也 就 是 2 598 960. 没 错 ， 


一 共有 


方法 求解 . 这 样 做 的 


展示 出 来 ; 然 


保证 答案 的 正确 性 . 如 果 两 种 不 同 的 方法 都 得 到 了 同一 


了 . 反之 , 如 果 得 到 了 不 同 的 答案 , 那么 我 们 知 


后 , 我 会 不 时 给 出 计算 这 些 概率 的 错误 方法 . 因为 我 很 粗心 , 所 以 可 能 会 给 
抓 住 并 消除 这 些 错 误 ! 不 , 我 是 故意 给 


这些 


3.2 扑克 
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错误 的 . 别 担心 , 我 很 快 就 会 告诉 你 它们 是 错 的 , 并 指出 错 在 哪里 . 使 用 
合理 的 错误 方法 来 考察 那些 已 被 解答 的 问题 是 很 有 好 处 的 . 这 些 都 是 人 们 在 概率 
我 希望 你 能 对 这 些 陷阱 有 一 定 的 了 解 . 


论 中 最 常 犯 的 错误 


和 问题 . 现在 , 开始 


3.2.2 ”最 小 牌 型 


计算 概率 吧 ! 


显然 , 本 节 会 非常 长 . 你 可 以 随意 地 跳 着 阅读 , 去 看 看 那些 你 觉得 有 趣 的 计算 


些 貌 似 


首先 计算 的 是 最 简单 的 牌 型 概率 . 这 意味 着 我 们 不 可 能 有 两 张 点 数 相同 的 牌 或 


我 们 降低 要 求 ， 


的 概率 . 不 要 着 急 , 我 们 稍 后 会 计 
同 花 是 很 罕见 的 , 它们 不 会 对 概率 产生 太 大 影响 , 所 以 我 们 的 误差 会 很 小 . 


者 5 张 伦 色相 同 的 牌 , 也 不 可 能 有 5 张 连 号 的 牌 . 


先 算出 所 有 有 牌 的 点 数 都 不 相同 的 概率 , 暂时 不 考虑 顺 子 和 同 花 


然后 直接 减 去 它们 束 行 了 . 顺 子 和 


一 共有 13 个 不 同 的 数 (2 到 10, 然后 是 J、Q、K 和 A), 我 们 从 中 挑选 出 5 个 


数 , 这 样 选 出 的 牌 就 不 会 出 现 相同 的 点 数 了 ; 


/人 


共有 (名 


种 方法 来 挑 出 这 5 个 数 . 


为 什么 ? 这 正 是 二 项 式 系数 的 定义 一 一 我 们 需要 从 13 个 数 中 无 次 序 地 选 出 5 个 


数 . 这 5 个 数 中 的 任何 一 个 均 可 以 是 黑 桃 、 红 桃 、 方 块 或 梅花 ， 


种 可 能 的 花色 . 


因此 每 个 数 都 有 4 


由 乘法 法 则 可 知 , 一 共有 (3) . 45 种 选 法 , 不 过 有 一 种 更 好 的 方式 来 看 待 这 
个 问题 : 把 这 个 结果 看 成 (3) (人 (4)()((9. 


色 中 选 出 一 种 的 做 


| 


法 要 重复 进行 5 次 我们 得 


这 里 的 5 


到 了 答案 1 317 888， 因 


个 (9) 指 的 是 从 4 种花 


此 概率 是 


1 317 888/2 598 960 = 2112/4165， 即 约 为 0.507 083 或 50.7083%( 记 住 , 分 母 是 
(全 )). 没 错 , 我 们 拿 到 最 小 牌 型 的 概率 约 为 50%. 


和 往常 一 样 , 我 们 看 看 能 否 通过 号 一 利 
可 以 从 52 张 牌 中 任 选 一 张 作 为 第 一 张 牌 . 由 了 


方法 来 计算 答案 . 一 共有 52 张 牌 . 我 们 
第 二 张 牌 的 点 数 不 能 与 第 一 张 的 相 


同 , 所 以 第 二 张 牌 可 以 从 剩 下 的 48 张 牌 中 任 选 一 张 . 第 三 张 牌 的 点 数 也 不 能 与 前 两 
张 的 相同 , 这 就 排除 了 52 张 牌 中 的 8 张 , 所 以 第 三 张 牌 有 44 种 选择 . 类 似 地 , 第 四 


张 牌 有 40 种 选择 , 而 最 后 


种 . 


在 计算 这 个 乘积 之 前 , 请 停 下 来 想 一 想 . 你 确信 这 个 值 与 之 前 的 一 上 
时 间 已 经 流逝 


是 1 317 888? 当 你 i 
建议 你 不 要 再 往 下 读 了 . 停 ! 拜托 ! 花 几 分 钟 时 间 想 想 , 这 两 个 数 是 否 真 的 相等 . 请 


卖 到 这 句 话 的 时 候 , 至 少 有 


两 分 钟 的 


不 要 做 乘法 运算 . 在 有 了 自己 的 判断 后 , 再 继续 往 下 读 . 


好 了 , 是 时 候 机 


张 有 36 种 选择 . 因此 , 最 小 牌 型 一 共有 52.48.44.40.36 


f 吗 ? 也 就 


日 乘 了. 我 们 发 现 52 .48 .44.40.36 等 于 158 146 560. 咽 , 这 个 


. 我 强烈 


数 比 1 317 888 大 一 些 . 好 吧 , 它们 不 相等 . 那么 大 了 多 少 呢 ?如 果 把 两 个 数 相 减 ， 


就 会 得 到 156 828 672. 村 


有 实证 明 , 做 减法 是 解决 不 了 这 类 问题 的 . 我 们 应 该 求 两 者 
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的 比值 . 通过 计算 , 我 们 得 到 比值 为 158 146 560/1 317 888 = 120. 这 很 有 趣 , 两 个 
数 的 比值 是 一 个 整数 . (这 就 是 计算 比值 的 原因 : 我 们 经 常 因为 弄 不 清楚 是 否 考虑 
次 序 而 写 错 因 子 , 但 比值 能 帮助 我 们 发 现 这 些 错误 . ) 
实际 上 , 还 有 更 多 真相 . 120 不 是 普通 整数 , 它 是 一 个 很 巧妙 的 整数 . 我 们 正在 
考察 一 个 组 合 问 题 , 却 到 处 看 到 阶乘 . 最 终 , 我 们 意识 到 120 就 是 51. 啊 , 原来 多 乘 
了 一 个 51, 而 我 们 正好 有 5 张 牌 . 这 并 非 巧合 . 
这 的 确 不 是 巧合 . 在 使 用 第 二 种 方法 时 , 我 们 意外 地 对 纸牌 进行 了 排序 . 再 看 
一 遍 论 证 的 开头 部 分 : 我 们 可 以 从 52 张 牌 中 任 选 一 张 作 为 第 一 张 牌 . 你 看 到 了 吗 ? 
我 们 考虑 了 次 序 ! 我 们 依次 讨论 了 第 一 张 牌 和 第 二 张 牌 , 等 等 . 但 是 , 并 不 在 乎 取 
牌 的 次 序 , 我 们 上 只 关 心 拿 到 了 哪些 牌 . 所 以 , 我 们 要 通过 除 以 51 来 删除 不 小 心 添加 
的 次 序 . 因此 , 一 共有 52 .48 .44.40.36/5! 种 可 能 的 取 法 . 
最 后 , 我 们 给 出 考察 这 个 问题 的 另 一 种 方法 . 如 果 想 从 有 序 的 角度 看 问题 , 那 
么 只 需 把 上 述 结果 除 以 “从 52 张 牌 中 依次 挑选 出 5 张 牌 ” 的 方法 数 就 行 了 ,， 即 
521/(52 一 5)! = 521/47! = 311 875 200. 按照 这 种 方法 , 求 出 “得 到 5 张 点 数 互 不 相 
同 的 牌 ”的 概率 是 158 146 560/311 875 200. 因此 , 最 小 牌 型 的 概率 就 是 2112/4165， 
这 与 前 面 的 概率 相同 ( 即 约 为 50.7083%). 
还 能 怎么 看 待 这 个 问题 呢 ? 我 喜欢 把 乘积 写作 ( 呈 ( 全 ) (多 (0 (36). 对 我 来 说 ， 
这 强调 了 正在 做 的 事 : 我 们 先 从 52 张 牌 中 选 出 一 张 , 然后 再 从 48 张 牌 中 选 出 一 
张 , 以 此 类 推 
最 后 , 我 们 用 Mathematica 代码 来 模拟 所 有 牌 的 点 数 均 不 相同 的 概率 . 编写 这 
类 代码 的 方法 有 很 多 种 , 最 难 的 部 分 是 确定 一 共有 多 少 个 不 同 的 数 ， 我 们 还 可 以 
使 用 MemberQ 函数 来 完成 这 一 操作 , 并 创建 牌 型 表格 , 这 是 以 前 从 未 见 过 的 值 的 
子 集 . 
nothing[numdo_] := Module[{}, 
count = 0; (* 成 功 次 数 的 计数 *) 
deck = 人 {; (* 把 deck 初 始 化 为 空 集 *) 
(* 创建 一 副 牌 (deck); 这 里 不 需要 考虑 花色 *) 
(* 得 到 1,1,1,1, 2,2,2,2,，... *) 
For[i = 1, i <= 13, i++, 


For[j = 1, j <= 4, j++, deck = AppendTo[deck, i]]]; 


SR 


For[n = 1, n <= numdo, n++, 

{ 
(* 检验 是 否 拿 到 5 张 不 同 的 牌 有 很 多 方法 *) 
(* 记录 纸牌 的 值 *) 
(* 每 张 牌 的 值 都 初始 化 为 0 *) 
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For[i = 1, i <= 13, i++, card[i] = 0] ; 
hand = RandomSample[deck, 5]; (* 选取 一 手 5 张 牌 *) 
(* 接 下 来 ， 对 5 张 牌 中 的 每 一 张 都 给 出 一 个 值 card[[i]] *) 
(* 我 们 只 关心 是 否 取 到 了 某 数 *) 
(* 所 以 不 必 担心 其 重复 出 现 的 次 数 *) 
For[k = 1, k <= 5, k++, card[hand[[k]]] = 1]; 
(* 只 有 在 取 到 5 个 不 同 的 数 时 ， 下 面 的 和 才 等 于 5 *) 
If[Sum[card[i], {i, 1, 13}] == 5, count = count + 1]; 
外; (* 结束 对 n 的 循环 *) 
Print["Theory says probability 5 distinct numbers is ", 2112/41.65, 
ly 
Print["Observed probability is ", 100. count/numdo, "%."]; 
] (* 结束 整个 模块 *) 
把 代码 运行 1000 万 次 就 会 产生 : 
Theory says probability 5 distinct numbers is 50.7083%. 
Observed probability is 50.7099%. 


3.2.3 ”对 子 


我 们 继续 往 下 看 . 考虑 了 所 有 牌 的 点 数 都 不 相同 的 情况 后 , 我 们 现在 看 看 恰 有 
两 张 牌 的 点 数 相 同 的 概率 , 即 出 现 对 子 的 概率 . 尽管 这 个 问题 听 起 来 很 简单 , 但 实 
际 上 会 有 一 些微 妙 之 处 . 我 们 将 考察 一 系列 难度 逐渐 增加 的 类 似 问 题 . 

问题 3.2.1 在 5 张 牌 中 , 恰 有 2 张 K 的 概率 是 多 少 ? 

这 意味 着 这 5 张 牌 中 必 有 2 张 是 K, 其 余 3 张 牌 要 从 48 张 非 K 的 牌 中 选 出 . 
从 4 张 中 选 出 2 张 的 方法 有 (2) 种 , 从 48 张 牌 中 选 出 3 张 共 有 ( 宁 ) 种 方法 . 因 
此 , 在 不 考虑 次 序 的 前 提 下 , 取出 2 张 K 和 3 张 非 K 的 方法 共有 (外 (从 ) = 103 776 
种 ; 另外 , 从 52 张 牌 中 无 次 序 地 取出 5 张 牌 , 一 共有 (号) = 2 598 960 种 方法 . 因此 ， 
5 张 牌 中 恰 有 2 张 K 的 概率 就 是 103 776/2 598 960 = 2162/54 145 0.039 929 8&， 
或 约 为 4%. 

下 面 这 段 简单 的 代码 用 来 计算 恰 有 2 张 K 的 概率 . 
twokings [numdo_] := Module[{}, 

count = 0; (* 成 功 次 数 的 计数 *) 

deck = {1，1，1，1}; (* 将 一 副 牌 (deck) 初始化 为 4 张 K *) 
(* 创建 deck 中 其 余 的 牌 ; 把 不 是 K 的 牌 记 作 0 *) 

For[i = 5, i <= 52, i++, deck = AppendTo[deck，0]] ; 


For[n = 1, n <= numdo, n++, 
{ 
hand = RandomSample[deck, 5]; (* 选取 一 手 5 张 牌 *) 
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(* 如 果 和 为 2， 那 么 恰好 有 2 张 K *) 
If[Sum[hand[[i]], {i, 1, 5}] == 2，count = count + 1]; 
}]; (* 结束 对 n 的 循环 *) 
Print["Probability of exactly 2 kings is ", 2162/541.45, "%."]; 
Print["Observed probability is ", 100. count/numdo, "4."]; 
] (* 结束 整个 模块 *) 
运行 10 000 000 次 后 的 结果 为 : 
Probability of exactly 2 kings is 3.99298%. 
Observed probability is 3.99252%. 
问题 3.2.2 ”在 5 张 牌 中 , 恰 有 一 个 对 子 的 概率 是 多 少 ? 
O 基于 上 一 个 问题 , 我 们 会 轻易 地 断定 , 由 于 恰 有 一 对 K 的 概率 是 4%, 而 且 一 
共有 13 种 可 能 的 对 子 , 所 以 恰 有 一 个 对 子 的 概率 就 应 该 是 52%. 不 六 的 是 , 这 种 分 
析 从 根本 上 说 是 有 缺陷 的 , 原因 有 二 . 第 一 , 可 能 出 现 两 个 对 子 , 比如 一 对 K 和 一 
对 J; 如 果 直 接 乘 以 13, 就 会 导致 重复 计数 的 问题 . 第 二 , 有 可 能 出 现 葫 疡 (比如 ， 
一 对 K 和 3 张 J]). 我 们 必须 非常 小 心 , 既 不 能 重复 计数 , 也 不 允许 出 现 3 张 点 数 一 
样 的 牌 . 
既 要 确保 不 遗漏 任何 可 能 性 ,又 能 保证 不 出 现 重 复 计数 的 最 优 计数 方法 是 什 
么 ? 一 副 牌 有 13 个 不 同 的 点 数 ; 我 们 可 以 先 选 出 对 子 的 点 数 , 然后 从 余下 的 12 个 
点 数 中 选 出 3 个 不 同 的 值 作为 剩 下 3 张 牌 的 点 数 . 例如 , 可 以 先 选 出 一 对 J, 然后 
必须 确保 剩余 3 张 牌 的 点 数 互 不 相同 , 并 且 都 不 是 J. 
先 从 13 个 点 数 中 选 出 一 个 作为 对 子 的 点 数 , 共有 (3) = 13 种 方法 ; 然后 再 从 
4 种 花色 中 选 出 2 种 作为 对 子 的 花色 , 共有 ( 种 方法 . 现在 还 剩 下 48 张 牌 , 我 们 
必须 从 中 选 出 3 张 , 并 且 它 们 的 点 数 要 互 不 相同 . 实现 这 一 点 有 几 种 方法 . 从 剩 下 
的 12 个 点 数 中 选 出 3 个 共有 (3) = 220 种 方法 . 对 于 每 种 选择 , 我 们 还 要 确定 牌 
的 花色 (因为 一 共有 4 种 花色 ), 每 张 牌 都 有 (人 种 可 能 的 花色 . 因此 , 选择 3 张 点 
数 互 不 相同 且 都 不 等 于 对 子 点 数 的 方法 共有 (22) (9? = 14 080 种 . 这 意味 着 , 选 出 
仅 包含 一 个 对 子 的 5 张 牌 共 有 ( 节 ) ( 约 . (22) 的 ”= 1 098 240 种 方法 . 由 于 我 们 不 考 
虑 次 序 , 所 以 求 概率 时 要 除 以 从 52 张 牌 中 选 出 5 张 的 方法 数 , 即 ( 呈 ) = 2 598 960. 
这 意味 着 恰好 得 到 一 个 对 子 的 概率 是 1 098 240/2 598 960 =352/833 ~ 0.422 569. 
请 注意 , 这 确实 与 我 们 猜测 的 概率 52% 非常 接近 , 但 它 的 值 会 更 小 . 这 一 点 并 不 奇 
怪 (因为 它 排除 了 存在 两 个 对 子 , 以 及 一 个 对 子 和 三 条 的 可 能 性 ). 
a 使 用 其 他 方法 计算 恰 有 一 个 对 子 的 概率 会 对 我 们 很 有 启发 ， 你 觉得 下 列 论 述 
正确 吗 , 还 是 有 错误 ? 如 果 有 错误 , 错 在 哪儿 ? 我 们 来 看 一 下 吧 . 
。 我 们 希望 恰好 取 到 一 个 对 子 ， 从 对 子 开始 , 第 一 张 牌 有 52 种 可 能 的 选择 . 
在 选 定 了 第 一 张 牌 之 后 , 为 了 得 到 一 个 对 子 , 第 二 张 牌 就 具有 3 种 可 能 的 
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选择 .| 


是 另 一 个 新 的 点 数 , 所 以 
此 有 40 种 可 


牌 的 相同 , 因 


52.3.48.44.40. 


。 另 外 , 对 子 的 点 数 共 有 (19) 种 选 法 , 花色 有 人 种 选 法 . 我 们 还 需要 选 


张 点 数 互 不 相同 


选 法 , 第 二 张 有 


, 且 都 不 等 于 对 子 点 数 的 短 
种 选 法 , 最 后 一 张 有 


44 


那么 , 这 两 个 论述 


与 Et 


都 比较 简洁 , 所 以 我 们 可 
清楚 存在 什么 样 的 危险 . 
第 二 种 方法 . 


门 先 看 看 


了 有 序 (上 


\ 表 31. 那么 ， 怎 相 


人 


已 


能 只 


>I 


牌 的 次 序 


删 掉 . 由 于 3 张 牌 共 


以 6. 这 样 就 得 到 了 正确 答案 ! 
好 的 , 这 就 解释 了 第 二 种 方法 出 现 了 什么 错误 . 那么 第 一 种 方法 有 什么 问题 ? 


这 两 种 方法 唯一 的 区 别 
法 一 开始 得 到 了 人 
牌 中 选 出 第 一 张 


办 | 


和 A 


EE 
和 代 ， 卫 


一 种 方法 在 
) (外 = 78. 这 个 错误 
为 考虑 了 次 序 , 所 以 这 种 做 法 是 错 的 


2! = 2 种 方法 . 我 们 多 乘 了 
成 了 6 589 440, 这 正 是 我 们 在 第 二 种 方法 


第 二 种 方法 的 错误 ) 


当 存 在 多 种 看 似 合理 的 方法 时 , 编 


面 来 修改 必 
点 数 的 频繁 程度 . 一 
次 数 . 当然 , 还 有 其 


个 


个 


有 44 利 
能 的 选 法 . 于 是 , 恰 


你 在 组 合 问题 中 看 到 6 


如 48 种 选 法 , 44 种 选 法 , 40 种 选 法 这 要 
有 3! 或 者 说 6 种 排序 方法 ， 


网 


办 


40 种 选 法 . 


正确 吗 ? 第 一 个 论述 给 出 了 13 178 
给 出 了 6 589 440 种 选 法 . 它们 都 不 等 于 正确 答案 1 098 240. 如 果 考 察 这 两 个 结 
答案 的 比值 , 我 们 发 现 第 一 个 比值 是 12, 第 二 个 比值 


犯 了 一 个 很 小 的 错误 . 我 们 知 


1 开始 时 得 到 


. 在 这 3 张 牌 中 , 第 


于 下 一 张 牌 的 点 数 必须 与 之 不 同 , 所 以 有 48 种 选择 ; 接 下 来 必须 
h 选 择 ; 最 后 一 张 牌 的 点 数 不 能 与 前 4 张 
好 取 到 一 个 对 子 的 方法 数 为 


出 3 


张 有 48 种 


880 种 选 法 ; 第 二 个 论述 


四 
个 


是 6. 由 于 这 两 个 比值 
道 , 解决 这 些 问题 的 关 


中 第 一 反应 应 该 是 : 也 许 
才能 得 到 3! 呢 ? 在 第 二 种 方法 中 , 刚 开始 的 做 法 与 之 前 
行 了 排序 ! 我 们 从 无 序 (二 项 式 系数 ) 变 成 
的 表达 ). 所 以 , 需要 把 最 后 3 张 


因此 应 该 让 6 589 440 除 


52 .3 二 156, 但 第 二 种 方 


数 相同 的 牌 共 有 3 种 方法 ; 但 是 , 为 什么 这 
牌 的 次 序 颠 倒 过 来 ? 换 名 话说, 我们 可 以 先 选 出 8h， 
再 挑 出 8@. 我 们 的 错误 在 于 , 对 2 张 点 数 相 同 的 牌 进行 了 排序 . 排 罗 


严重 ， 


难以 理解 和 解释 . 我 们 从 52 张 


三 二 


十 朱 一 


因子 2. 注意 


[| 


在 除 以 2 之 


EC 


张 牌 ? 为 什么 不 能 把 挑选 这 两 张 
再 选 出 89; 而 不 必 先 挑 出 8%， 


. 接 下 来 , 选 出 男 一 张 点 


上 2 张 牌 共 有 
后 , 第 一 种 方法 的 结果 变 


Ph 得 到 的 结果 (我 


与 


些 代码 并 收集 相关 数据 是 有 价值 的 . 下 


门 已 经 知道 了 如 何 改 正 


Bb 段 计算 惟有 2 个 KK 的 代码 . 有 很 多 方法 可 以 
特别 简单 的 方法 是 构造 一 个 数组 , 用 来 保存 每 个 点 数 出 现 


耐用 到 的 简 
点 数 ). 然后 算 一 下 
个 不 同 的 点 数 . 


单方 法 就 是 , 观察 是 否 


他 的 方法 (我 最 喜欢 的 方法 是 使 用 
取 到 1,2,3,.… ,13( 这 些 数 用 来 表示 13 个 不 同 
取 到 多 少 个 不 同 的 点 数 , 要 注意 恰 有 一 个 对 子 等 价 于 


a 


录 我 们 两 次 取 到 同一 个 


UU 


素数 和 独特 的 


日 
因数 分 解 ). 下 
日 


共有 4 
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onepair [numdo_] := Module[{}, 
count = 0; (* 成 功 次 数 的 计数 *) 
deck = 人 {; (* 把 一 副 牌 (deck) 初 始 化 为 空 集 *) 
(* 创建 deck; 这 里 不 考虑 花色 *) 
(+ 得 到 1,1,1,1，2,2,2,2，.. *) 
For[i = 1, i <= 13, i++, 
For[j = 1, j <= 4, j++, deck = AppendTo[deck, i]]] 
For[n = 1, n <= numdo, n++, 
{ 
(* 验证 是 否 只 有 一 个 对 子 有 很 多 方法 *) 
(* 记录 纸牌 的 值 *) 
(* 每 张 牌 的 值 都 初始 化 为 0 *) 
For[i = 1, i <= 13, i++, card[i] = 0] ; 
hand = RandomSample[deck, 5]; (* 选取 一 手 5 张 牌 *) 


(* 接 下 来 ， 对 5 张 牌 中 的 每 一 张 都 给 出 一 个 值 card[[i]] *) 


(* 我 们 只 关心 是 否 取 到 了 菜 数 和 
(* 所 以 不 必 担 心 其 重复 出 现 的 次 数 和 

For[k = 1, k <= 5, k++, card[hand[[k]]] = 1]; 

(* 只 有 在 恰好 取 到 1 个 对 子 时 ， 下 面 的 和 才 等 于 4! *) 


If[Sum[card[i], {i, 1, 13}] == 4, count = count + 1]; 


}]; (* 结束 对 n 的 循环 *) 


Print["Theory says probability one pair is ", 352/8.33, "%."]; 


Print["Observed probability is ", 100. count/numdo, "%."]; 


] (* 结束 整个 模块 *) 


运行 10 000 000 次 的 结 采 强 有 力 地 支持 了 我 们 的 第 一 利 
Theory says probability one pair is 42.2569%. 
Observed probability is 42.2502%. 


方法 . 


比值 法 : 对 答案 进行 比较 的 比值 法 是 值得 强调 的 . 比值 法 


具 ]] 


值 通常 是 整数 , 并 且 能 给 出 哪里 出 错 的 线索 . 例如 , 如 果 看 至 
720 这 样 的 比值 , 你 应 该 想到 阶乘 ! 此 外 , 要 时 刻 警 惕 不 要 引入 不 该 出 现 的 次 序 . 


E 的 优点 是 , 这 些 比 
上 | 2、6、24、120 和 


3.2.4 两 对 


在 考察 恰 有 一 个 对 子 的 情况 时 , 我 们 已 经 花费 了 大 量 时 间 ， 因 此 , 我 
求 出 恰 有 两 个 对 子 的 概率 . 我 们 先 选 出 两 个 点 数 , 并 且 每 个 点 数 都 要 重复 出 
然后 再 选 出 第 三 个 不 同 的 点 数 . 从 13 个 点 数 中 选 出 2 个 , 一 共有 多 少 种 方法 


正 是 (3). 对 于 每 一 个 点 数 , 我 们 必须 为 其 选择 2 种 花色 , 共有 (人 种 选 法 . 最 后 一 


] 会 快速 


?答案 
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张 牌 必须 是 一 个 不 同 的 点 数 , 它 要 从 剩 下 的 11 个 点 数 中 挑选 一 个 , 共有 ( 工 ) 种 选 法 . 


另外 , 最 后 


张 牌 的 花色 有 (各 种 . 综 上 所 述 , 我 们 得 到 (区 (的 ?( 茹 (9 = 123 552. 


因此 , 惟有 马 


个 对 子 的 概率 是 123 552/2 598 960, 或 约 为 4.7539%. 


3.2.5 ”三 条 


恰 有 3 


张 点 数 相同 的 牌 , 这 种 情况 3 


不 可 怕 ; 真正 的 问题 是 要 确保 剩 下 的 2 


张 牌 有 不 同 的 点 数 . 重复 出 现 3 次 的 点 数 有 (23) 种 选 法 . 之 后 , 我 们 还 要 从 4 种 花 


色 中 为 其 先 
的 点 数 共 
一 种 , 即 (2) 


出 3 种 , 共有 (3) 种 选 法 . 好 


, 现在 考虑 剩 下 的 2 张 牌 . 选 出 2 个 不 同 


( 马 种 方法 .对 于 每 一 个 点 数 , 我 们 可 以 为 其 选择 4 种 花色 中 的 任何 


种 选 法 . 因此 , 选 牌 的 方法 数 为 ()( 汪 ( 旺 )( 昌 ”, 即 54 912. 于 是 , 5 张 
路 中 恰 有 3 张 牌 点 数 相同 的 概率 是 54 912/2 598 960, 即 88/4165 心 0.021 128 5( 约 
为 2.112 85%). 


除 此 之 外 , 还 可 以 怎样 计算 呢 ? 我 们 需要 从 13 个 点 数 中 选 出 3 个 不 同 的 点 数 ， 


这 有 (3) 种 选 法 ; 而 且 其 中 一 个 点 数 要 
于 这 个 重复 出 现 3 次 
个 点 数 中 的 和 


E 复 出 现 3 次 , 这 个 点 数 有 (3) 种 选 法 . 对 


的 点 数 , 我 们 要 为 其 选 出 3 种 花色 , 共有 (和 种 选 法 . 另外 2 
EF 意 一 个 都 可 以 从 4 种 花色 中 任 选 一 种 , 这 样 就 给 出 了 2 个 因子 (人 


综 上 所 述 , 5 张 牌 中 恰 有 3 张 牌 点 数 相同 的 情况 有 (2) (3) (入 (和 ?种 . 再 看 一 下 , 你 


觉得 这 种 方法 如 何 ? 它 正确 吗 ? 有 重复 计数 的 问题 吗 ? 有 没有 遗漏 了 什么 ? 是 否 无 
意 间 添 加 了 次 序 ? 
来 计算 一 下 ， 把 所 有 的 项 相 乘 得 到 54 912, 与 之 前 的 结果 一 样 ! 这 
次 用 “其 他 的 ”方法 真 的 给 出 了 相同 的 答案 ! 注意 , 这 并 不 意味 着 我 


下 面 就 


是 我 们 第 一 


们 的 答案 是 


正确 的 ， 如果 我 们 有 两 个 不 同 的 答案 , 很 明显 其 中 一 个 是 错误 的 ; 然 


而 ， 仅 由 两 种 不 


题 越 复杂 , 两 种 不 同 的 方法 能 得 到 相同 结果 的 难度 就 武大 , 除非 它们 都 给 出 了 正确 


答案 . 


这 里 的 逻辑 非常 好 . 我 们 既 没 有 重复 计数 , 也 没有 意外 添加 次 序 . 请 留意 我 介 
有 多 小 心 . 我 们 一 直 使 用 二 项 式 系数 , # 


司 的 方法 得 到 了 相同 的 答案 并 不 能 说 明 答 案 是 正确 的 ， 当然， 问 


日 没有 让 数量 相 乘 . 这 是 不 用 考察 次 序 的 


好 迹象 . 开始 时 , 我 们 得 到 了 (), 然后 给 出 ( 引 . 我 们 非常 小 心 , 没有 对 3 张 点 数 
相同 的 牌 排序 . 


3.2.6 ” 顺 子 、 同 花 和 同花顺 


把 顺 子 和 同 花 放 在 一 起 考虑 是 个 不 错 的 想法 . 原因 是 我 们 必须 要 小 心 : 同花顺 
既是 顺 子 又 是 同 花 . 先 看 看 有 多 少 个 顺 子 , 并 允许 顺 子 也 可 以 是 同 花 . 然后 再 看 看 
有 多 少 个 同 花 (也 允许 同 花 是 顺 子 ). 最 后 , 我 们 会 计算 有 多 少 个 同花顺 . 把 这 个 结 


果 从 前 面 两 个 结果 中 减 去 就 得 到 了 答案 . 


©O 
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有 多 少 个 顺 子 呢 ? 我 们 需要 5 个 连续 的 数 , 但 它们 可 以 按照 任意 次 序 给 出 . 用 
T 表示 10, 那么 顺 子 可 以 是 A2345、23456、34567、45678、56789、6789T、789TJ、 
89TJQ、9TJQK 和 TJQKA. 一 共有 10 种 可 能 情况 . 对 于 任意 一 种 情况 , 每 个 数 都 
有 4 种 花色 可 供 选 择 . 因此 , 有 10 .45 = 10 240 个 可 能 的 顺 子 . 

有 多 少 个 同 花 ? 记 住 , 同 花 是 5 张 花 色相 同 的 牌 ， 所 以 , 同 花 有 (1 种 可 
能 的 花色 , 接 下 来 上 只 需要 选 出 5 个 点 数 就 行 了 , 我 们 有 ( 宇 ) 种 选 法 . 因此 , 共有 
(外 () = 5148 个 同 花 . 

最 后 , 有 多 少 个 同花顺 呢 ? 同花顺 的 求法 与 顺 子 相似 , 唯一 的 变化 就 是 把 因子 
4 替换 为 (?)15( 有 4 种 花色 可 供 选 择 ; 在 选 定 花色 后 , 这 5 张 牌 的 花色 就 都 确定 
了 下 来 ). 于 是 , 我 们 得 到 了 10 .4 = 40 个 同花顺 . 

现在 把 这 些 细节 综合 起 来 . 不 是 同花顺 的 顺 子 有 10 240-40= 10 200 个 , 因此 取 
到 顺 子 的 概率 是 10 240/2 598 960=128/32 48720.003 940 04, 约 为 0.394 004%. 同 
样 , 不 是 同花顺 的 同 花 有 5148-40= 5108 个 , 所 以 取 到 同 花 的 概率 为 5108/2 598 960， 
约 为 0.196 54%. 最 后 , 同花顺 的 数量 是 40, 取 到 它 的 概率 大 约 是 0.001 539 08%. 


3.2.7 ”葫芦 和 铁 支 


所 有 的 牌 型 都 差不多 说 完了 , 你 还 爱 玩 扑 克 牌 吗 ? 这 些 计算 看 起 来 可 能 很 长 且 
无 穷 无 尽 , 但 请 记 住 我 们 只 需要 计算 一 次 . 当 求 出 这 些 概率 之 后 , 我 们 就 知道 该 如 
何 组 合 手中 的 牌 , 并 且 能 估算 出 赢 和 输 的 相对 概率 . 

好 了 , 我 们 看 看 取 到 葫芦 的 概率 . 葫芦 由 3 张 点 数 相同 的 牌 和 一 个 对 子 组 成 ， 
并 且 对 子 的 点 数 与 其 余 3 张 的 不 同 . 重复 出 现 3 次 的 点 数 有 ( 衬 ) 种 选 法 , 然后 从 4 
种 花色 中 选 出 3 种 分 配给 3 张 点 数 相同 的 牌 , 共有 (3) 种 选 法 . 剩 下 2 张 牌 的 点 数 
必须 相同 , 所 以 我 们 要 从 余下 的 12 个 点 数 中 选 出 一 个 , 共有 (?) 种 方法 . 另外 , 这 
2 张 牌 的 花色 有 (外 种 选 法 . 综 上 所 述 , 戎 芦 的 个 数 是 ( 菩 () (人 (2) = 3744. 因此 ， 
取 到 戎 芦 的 概率 是 3744/2 598 960, 约 为 0.144 058%. 

下 列 论证 是 否 正确 : 我 们 需要 选 出 2 个 不 同 的 点 数 , 这 刚好 有 (2) 种 选 法 . 对 
于 第 一 个 点 数 , 牌 的 花色 有 (和 种 选 法 ; 对 于 第 二 个 点 数 , 牌 的 花色 有 (外 种 选 法 ， 
于 是 我 们 得 到 了 (2 (3) (3) = 1872. 

这 种 情况 是 第 一 次 出 现 结果 不 是 太 大 , 而 是 太 小 了 ! 取 这 两 个 结果 的 比 
值 , 得 到 3744/1872 = 2. 我们 该 如 何 理解 这 个 比值 呢 ? 问题 就 出 在 因子 2 上 . 这 
可 能 不 是 重复 计数 的 问题 , 更 有 可 能 是 我 们 遗漏 了 什么 . 但 遗漏 了 什么 呢 ? 这 很 微 
妙 , 出 错 的 地 方 是 “第 一 个 点 数 ” 这 种 表达 . 重复 出 现 3 次 的 点 数 可 能 是 第 二 个 , 而 
不 是 第 一 个 ! 我 们 忽略 了 这 种 情况 ! 我 们 要 考虑 把 这 2 个 点 数 中 的 哪 一 个 分 配给 3 
张 牌 , 完成 这 一 步 有 @?) 种 方法 . 因此 , 答案 应 该 是 ( 且 就 是 )( 驴 ) () (3) (人 )， 即 3744. 
我 们 可 以 把 这 个 结果 看 成 , 选 出 2 个 不 同 点 数 的 方法 有 ( 当 ) 种 , 然后 有 (?) 种 方法 


Te 
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来 确定 哪个 点 数 出 现 3 次 , 哪个 点 数 出 现 2 次 . 剩 下 的 ( 分 (9 指 的 是 选 出 3 张 点 数 
相同 的 牌 和 另外 2 张 点 数 相 同 的 牌 有 几 种 方法 . 此 时 , 我 们 已 经 确定 了 哪个 点 数 出 
现 3 次 , 哪个 点 数 出 现 2 次 . 换 名 话说 , 我 们 可 以 把 这 个 乘积 分 成 两 部 分 ， (13) (3 
和 (的 .这 里 的 (1)(?) = 13 .12 表示 选 出 2 个 不 同 的 点 数 , 并 确定 哪个 点 数 出 
现 3 次 , 哪个 点 数 出 现 2 次 的 方法 数 ， (入 (和 ) 指 的 是 为 第 一 个 点 数 选 出 3 种 花色 
为 第 二 个 点 数 选 出 2 种 花色 的 方法 数 . 
在 这 种 情况 下 ,编写 一 些 简 单 的 代码 ,从 数值 的 角度 考察 概率 是 非常 有 用 的 . 

当 我 们 不 清楚 是 否 无 意 中 添 加 了 一 些 额外 的 次 序 或 是 遗漏 了 某 个 因素 时 , 这 种 方法 
就 显得 尤为 重要 . 下 面 这 个 简单 的 程序 用 来 计算 随机 选 出 的 5 张 牧 是 萌 芦 的 概率 . 
注意 , 如 果 能 恰当 地 标记 纸牌 , 就 可 以 很 容易 地 判断 出 是 否 取 到 了 萌 芦 . 
fullhousesearch[num_] := Module[{}, 

(* 创建 一 副 牌 ， 因 为 我 们 只 关心 点 数 *) 

(* 所 以 这 里 忽略 花色 ， 并 将 每 个 点 数 写 4 遍 *) 

cards = {}; 

fullhouse = 0; 

For[d = 1, d <= 13, d++, 


| 


For[i = 1, i <= 4, i++, cards = AppendTo[cards, dl]]]; 
(* 这 里 是 主 代码 ,重复 num 次 *) 
For[n = 1, n <= num, n++, 
{ 
(* 从 52 张 牌 中 随机 选取 5 张 并 排序 ，*) 
(* 很 容易 验证 ， 当 这 手 牌 被 排序 时 是 否 取 到 了 戎 芦 *) 
(* 如 果 前 3 张 牌 点 数 相同 并 且 其 余 2 张 的 点 数 也 相同 *) 
(* 或 者 前 2 张 牌 点 数 相同 并 且 其 余 3 张 的 点 数 相同 *) 
(* 那么 就 得 到 了 一 个 戎 芦 *) 
hand = Sort [RandomSample[cards，5]] ; 
If[hand[[1]] == hand[[2]] && hand[[4]] == hand[[5]]， 
If[hand[[3]] == hand[[2]] || hand[[3]] == hand[[4]] ， 
fullhouse = fullhouse + 1]]; 
}]; 
Print["Percent of time got full house is "， 
100.0 fullhouse/num, "."]; 
(* 现在 输出 预测 ， 可 以 看 到 第 一 个 结果 和 我 们 的 数值 非常 接近 *) 
Print["The [predictions were 0.144058% and 0.072029%."]; 
]; 
输入 fullhousesearch[1000000] 就 意味 着 我 们 正 随 机 地 取出 100 万 种 可 能 
的 5 张 牌 , 由 此 可 得 取 到 葫芦 的 概率 大 约 是 0.1447%. 这 与 我 们 的 第 一 个 答案 ( 约 
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为 0.144 058%) 几乎 相等 , 但 它 与 第 二 个 结果 ( 约 为 0.02%) 不 同 , 关键 


少 了 一 个 因子 2! 


我 们 已 经 接近 


了 终点 . 最 后 的 人 


方法 来 选 出 4 张大 
种 取 法 , 也 就 是 (4 


4 


非常 小 , 约 为 0.024 


共同 的 点 数 . 接 下 来 , 这 个 点 


009 6%. 


3.2.8 ”扑克 牌 型 练习 工 


最 后 给 出 儿 个 
改过 的 事情 ,又 能 


同 的 符号 来 强调 计 


我 们 必须 小 心 


因为 有 些 方法 能 被 一 个 人 到 
的 字母 来 表示 不 同 数 , 以 此 来 强调 不 同 的 导 
问题 3.2.3 在 5 张 牌 中 , 至少 有 


| 


问题 来 结束 对 扑克 牌 的 研究 . 这 是 利 
保 我 们 所 做 的 一 切 都 是 正确 的 . 在 本 节 中 ， 
算 的 不 同方 面 ， 对 我 们 来 说 ,从 多 利 
LE 解 并 不 意味 着 能 被 男 一 个 人 型 


型 . 


| 


了 王 
x 


确保 列举 了 所 有 的 可 能 情况 ， 让 4、B 


E 务 是 求 出 恰好 取 到 铁 支 的 概率 . 一 
数 必须 取 饥 所 有 4 和 和 
)). 最 后 , 我 们 要 选 出 第 5 张 牌 . 它 可 以 从 剩 下 的 48 张 
一 张 . 于 是 , 恰好 取 到 4 张 点 数 相同 的 牌 的 方法 有 (3) (和 (8) = 624 利 


不 错 的 做 法 , 既 回 


的 


S 有 (1 ) 和 
花色 ( 
小 中 任 取 
| 它 的 概率 


]A 人 AN 


顾 了 我 们 
我 们 会 使 用 一 些 不 


角度 考察 问题 是 很 有 用 的 ， 
LE 解 . 接 下 来 , 我 们 


利 不 同 


2 张 点 数 相 同 的 概率 是 多 少 ? 


和 C 等 分 别 表 示 


不 同 的 点 数 ， 并且 忽略 牌 的 花色 . 那么 ,存在 以 下 几 种 牌 型 : 恰好 取 到 一 个 对 子 


(44BCD), 取 到 了 


(4444B), 恰好 取 到 两 个 对 子 (44BBO), 或 者 取 到 
点 数 相同 的 牌 (44BBB). 注意 , 这 些 事 件 是 互 不 相交 站 
有 可 能 性 . 因此 , 我 们 只 需要 求 出 取 到 每 一 种 牌 型 的 方法 数 就 行 了 . 
十 算 了 取 到 第 一 利 


日 、 


张 点 数 相同 的 牌 但 非 萌 六 (444BC), 取 到 


4 张 点 数 相同 的 牌 


个 葫芦 ， 


即 一 个 对 子 和 3 张 


的 ,而 且 


Ph 牧 型 44BCD 的 方法 数 , 即 


它们 已 经 涵盖 了 所 


1 098 240. 现在 , 我 


3.2.3 节 趾 


们 来 考虑 剩 下 的 短 
回顾 我 们 所 做 事情 


再 
会 更 通 


事 


少 , 你 可 以 i 


过 查看 前 面 的 章节 来 获得 更 


型 . 虽然 可 以 直接 引用 
的 好 方法 ; 当然 , 有 些 读者 可 能 跳 过 了 前 面 
详细 的 信息 


忆 \ 


对 于 三 条 但 非 
3 次 的 点 数 有 (二 


法 ; 然后 , 考虑 剩 下 的 2 个 点 数 ， 


牌 可 供 选 择 ). 

铁 支 AAAAB 
剩 下 的 12 个 点 数 
P 的 一 利 


口 


”此 外 , 得 到 这 个 
有 (48) = 48 种 选 法 


| 


= 


葫芦 的 
种 


选 法 ; 接 下 来 , 从 点 数 相同 的 4 张 牌 中 选 


过 前 的 结果 , 但 还 是 重 


的 部 分 ! 这 次 的 尘 


型 , 我 们 有 (23) ( 约 (22) (区 ”= 54 912 种 取 法 ( 


新 计算 一 次 . 这 是 
E 释 


E 复 出现 


& 有 (22) 种 选 法 ,大 


共有 ( 交 ( 人 :09) (人 ) = 624 种 取 法 
P 选 出 一 个 ; 在 选 定 这 个 点 数 之 后 , 我 们 还 要 


我 们 考虑 恰 有 两 个 对 子 的 情况 44BBC. 首 9 


( 芭 种 选 法 . 对 了 


E 要 确定 


『 每 一 个 选 定 的 点 数 , 我 们 必须 从 它 所 对 应 的 4 张 短 


其 中 任何 一 


两 个 对 


H 3 张 , 有 (和 种 先 
个 点 数 都 有 ( 引 红 


1 入 


因子 () (和 = 48 指 的 是 从 


为 其 选择 4 种 花色 


因子 的 另 一 种 方法 是 , 选择 剩 下 48 张 牌 中 的 任何 一 张 ， 


子 的 点 数 , 它们 有 
PF 选 出 2 张 ， 


| 


口 
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有 (2) 种 选 法 . 现在 还 剩 下 52 - 8 = 44 张 牌 , 它们 的 点 数 均 与 两 个 对 子 的 点 数 不 
同 ; 从 这 44 张 牌 中 选 出 1 张 共 有 ( 负 种 方法 . 因此 , 恰好 取 到 两 个 对 子 的 方法 数 
为 (3) (9 (0) = 123 552. 

最 后 , 我 们 来 计算 取 到 戎 态 44BBB 的 方法 数 . 我 们 要 小 心 一 点 , 因为 弄 清楚 
哪个 点 数 出 现 3 次 , 哪个 点 数 出 现 2 次 是 很 重要 的 . 选 出 2 个 不 同 的 点 数 有 (3) 
种 方法 , 接 下 来 要 确定 哪个 点 数 出 现 2 次 , 哪个 点 数 出 现 3 次 ; 有 (?) 种 可 能 性 . 这 
样 就 得 到 了 结果 ( 当 )( 引 (多 ( 汪 = 3744. 男 一 种 思路 是 , 我 们 必须 从 13 个 点 数 中 选 
出 2 个 . 不妨 设 第 一 个 点 数 重复 出 现 2 次 , 第 二 个 点 数 重复 出 现 3 次 . 那么 , 取 到 2 
张 点 数 相同 的 牌 共 有 (也 ) (2 种 方法 . 接 下 来 , 由 于 还 剩 下 12 个 点 数 , 因此 得 到 3 
张 点 数 相同 的 牌 有 ( 闻 ) (3) 种 方法 . 于 是 , 取 到 葫芦 的 方法 数 为 (区 ) (3).( 世 (人 9， 等 
于 3744. 我 们 再 次 看 到 , 对 于 同一 个 事件 , 可 以 采用 多 种 方法 来 考察 . 

现在 , 把 上 面 的 结果 加 起 来 就 求 出 了 5 张 牌 中 至 少 有 2 张 牌 点 数 相 同 的 取 牌 
方法 数 , 即 


1 098 240 十 54912 十 624 十 134768 十 3744 = 1 281 072. 


这 意味 着 5 张 牌 中 至 少 有 2 张 牌 点 数 相 同 的 概率 是 1 281 072/2 598 960= 2053/ 
4165 导 0.492 917. 因此 , 至 少 有 2 张 牌 点 数 相 同 的 概率 接近 于 50%! 

还 有 另 一 种 更 简单 的 方法 来 计算 至 少 取 到 2 张 具有 相同 点 数 的 牌 的 概率 . 之 
前 我 们 证 明了 所 有 牌 的 点 数 均 不 相同 的 概率 是 2112/4165, 因此 , 由 互补 概率 法 则 
可 知 , 这 个 问题 的 答案 就 是 


2112 2053 


4165 4165 

这 与 我 们 前 面 的 计算 结果 一 样 , 工作 量 却 少 得 多 ! 为 什么 要 把 那么 多 时 间 都 花 在 如 
此 元 长 乏味 的 计算 上 呢 ? 为 了 强调 这 个 计算 兄长 而 乏味 , 你 应 该 不 断 地 问 自己 : 这 
是 解决 问题 的 最 好 方法 吗 ? 把 所 有 可 能 的 情况 都 列举 出 来 是 非常 危险 的 : 情况 越 
多 , 你 越 有 可 能 把 某 些 情况 遗漏 掉 , 或 者 在 运算 时 出 现 错误 . 如 果 计 算 起 来 很 头疼 ， 
那 就 看 看 是 否 有 更 好 的 方法 . 
习题 3.2.4 ”假设 我 们 正在 玩 一 种 非常 简单 的 扑克 有 牌 游戏 , 两 个 玩家 都 只 有 两 
张 牌 . 每 个 玩家 都 知道 自己 的 一 张 牌 是 什么 , 但 不 知道 另 一 张 牌 是 什么 . 你 有 一 张 
牌 是 10. 你 的 对 手 不 擅长 玩 这 个 游戏 , 不 小 心 向 你 透露 他 有 一 张 A. 你 获胜 的 概率 
是 多 少 ? 另外 , 当 两 人 拿 到 点 数 相同 的 牌 时 , 我 们 也 认为 你 输 了 . 


3.2.9 ”扑克 牌 型 练习 II 


考虑 5 张 扑 克 牌 , 前 2 张 牌 是 黑 桃 A 和 方块 8, 记 作 {A@,80}. 我 们 还 要 再 补 
上 3 张 牌 才能 得 到 5 张 . 由 于 前 2 张 牌 的 花色 不 同 , 并 且 介 于 它们 之 间 的 点 数 超过 
了 4, 因此 我 们 不 可 能 取 到 顺 子 和 同 花 . 
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例 3.2.5 


从 {Ah ,8O} 开始 , 补 上 3 张 牌 后 就 得 到 了 5 张 


小 ,那么 这 5 张 牌 


中 恰 有 一 个 对 子 , 且 这 个 对 子 既 不 是 两 个 A, 也 不 是 两 个 8 的 概率 是 多 少 ? 


现在 还 剩 下 50 张 牌 ; 但 我 们 已 经 知 
FP 抽 取 . 
有 EJ . 


下 的 3 张 牌 要 从 50 一 
和 8, 因为 它们 已 经 


Lt 


6 = 44 张 牌 


现在 5 张 牌 


们 无 法 从 {A9,AO, Ag 和 ,8h, 89 ,8 各 } 中 选 牌 . 这 相 


名 剩 下 了 


道 , 对 子 的 点 数 不 可 能 是 A 和 8, 所 以 剩 
为 什么 是 44 呢 ? 我 们 显然 不 能 选择 A@ 
于 不 可 能 出 现 两 张 A 和 两 张 8, 所 以 我 


44 张 牌 . 


因为 只 有 一 


个 对 子 , 所 以 取 法 只 能 是 两 张 2 和 一 张 不 是 2、8、A 的 牌 , 或 者 两 张 3 和 一 张 不 是 


3、8、A 的 牌 , 等 等 . 有 和 多少 利 
括 A: {2,3,4,5,6,7,9,10,J,Q,KK}. 我 们 必须 从 这 些 点 数 


种 选 法 


可 能 的 取 法 呢 ? 我 们 有 11 个 点 数 , 既 不 包括 8 也 不 包 


Ph 选 出 一 个 , 有 


,一 旦 选 定 了 这 个 点 数 , 我 们 就 会 有 4 张 这 样 的 牌 . 举 个 例子 , 如 果 我 们 想 


11 


G) 


要 有 一 对 6, 那么 就 必须 从 {6 和 ;69, 602,6 各 } 中 选 出 2 张 , 这 有 ( 浊 = 6 种 选 法 . 接 
下 来 , 我 们 要 选 出 最 后 一 张 牌 . 它 不 可 外 


数 . 这 张 牌 有 52 
种 方法 . 
在 如 


给 定 


12 = 40 种 可 能 的 选择 , 因 


EE 是 8 和 A, 也 不 可 外 


此 从 中 选 出 最 后 


是 我 们 刚刚 选 出 的 点 
张 牌 有 (40) = 40 


了 一 张 A 和 一 张 8 之 后 , 为 了 得 到 恰 有 一 个 对 子 且 对 子 的 点 数 既 不 是 


A 也 不 是 8 的 5 张 牌 , 剩 下 的 3 张 牌 有 (二 的 (多 = 11. 6.40 = 2640 种 选 法 . 为 


了 求 出 概率 , 我 们 要 让 这 个 结果 除 以 从 剩 下 的 50 张 牌 


(®) =50. 49. 48/3! = 
等 于 13.4694%. 


中 选 出 


上 3 张 牌 的 方法 数 , 即 


19 600, 因此 我 们 想 求 的 概率 为 2640/19 600 = 33/245, 或 约 


我 已 经 讲 过 很 多 次 了 , 如 果 能 使 用 多 种 方法 解决 问题 , 那 就 应 该 这 样 做 . 这 是 


检查 和 捕获 错误 的 好 方法 . 我 们 能 

下 面 用 一 种 考虑 次 序 的 方法 来 解决 这 个 问题 
季 中 的 问题 , 让 B、C 和 万 分 别 
s A 牌 了 ), 那么 我 们 的 牌 型 


对 子 . 类 似 于 3.2.8 - 
因为 4 


了 A 和 8 之 外 的 任何 一 
牌 的 相同 , 但 花色 不 同 


不 可 能 与 第 三 和 第 四 张 牌 的 点 数 相 


选 法 . 


已 经 被 用 来 表示 
A8BCC. 对 于 第 一 种 牌 型 


(A8BBC), 第 


找到 解决 这 个 问题 的 另 一 种 有 效 方法 吗 ? 
. 我 们 希望 这 5 张 牌 


中 恰 有 


人 
只 能 是 


三 张 牌 有 44 种 可 外 


表示 不 同 的 数 (不 外 


使 用 
A8BBC, A8SBCB 9 
的 选择 ( 它 可 以 是 除 


张 ), 第 四 张 牌 有 3 种 可 能 的 选择 ( 它 的 点 数 必须 与 第 三 张 


最 后 


张 牌 


)» 


I 


对 于 A8BCB 牌 型 , 我 们 看 到 第 三 


( 它 的 点 数 必须 与 前 3 
12 张 不 能 选 , 这 样 就 只 


同 ). 因此 ,多 


有 40 种 可 能 的 选择 ( 它 既 不 可 


能 是 bh 


性 


A 和 8%， 


第 


种 牌 型 


I 


长 牌 有 44 种 选择 , 第 四 张 牌 有 40 种 选择 


张 牌 


的 不 同 . ! 


仍 有 40 种 选择 . 因 


为 第 五 张 牌 


剩 下 40 张 牌 了 ). 最 后 
数 必须 与 第 三 张 牌 相同 ). 于 是 , 第 二 种 牌 型 有 44 : 40 .3 = 5280 种 选 法 . 

最 后 ， 我 们 集中 注意 力 考察 A8BCC. 第 三 张 牌 仍然 有 44 种 选择 , 第 四 张 牌 
必须 与 第 四 张 牌 的 点 数 相 同 但 


于 前 3 张 的 点 数 互 不 相同 ， 
4 有 3 种 可 能 以 


一 张 牌 只 


有 44.3.40 = 5280 种 


Ex 


因此 52 张 牌 中 有 


选择 ( 它 的 点 


也 


花色 不 同 , 所 以 它 有 3 
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种 选择 . 


因此 , 这 种 牌 型 同样 有 44 .40 .3 = 5280 种 选 法 . 


为 了 得 到 恰 有 一 个 对 子 且 对 子 的 点 数 既 不 是 A 也 不 是 8 的 5 张 牌 , 最 后 3 张 
牌 的 有 序 排列 方法 数 为 5280 + 5280 + 5280 = 15 840, 即 所 有 结果 之 和 . 当 考 虑 先 
后 次 序 时 , 剩 下 的 3 张 牌 有 50.49.48 = 117 600 种 选 法 . 做 除法 之 后 , 得 到 想 要 牌 


al 


型 的 概率 是 15 840/117 600= 33/245, 或 约 为 13.4694%. 
欢呼 吧 ! 我 们 得 到 了 和 以 前 一 样 的 答案 . 这 个 例子 的 富 意 是 , 不 存在 解决 这 些 


问题 的 强制 特 


方法 . 如果 你 喜欢 生活 在 整洁 有 序 的 世界 里 : 就 尽管 去 吧 ! 相反 , 如 


果 你 想 反 抗 权威 , 过 没有 秩序 的 生活 , 那 也 是 可 以 的 ! 但 是 请 记 住 , 要 保持 一 致 . 不 
例如 , 在 第 二 种 方法 中 , 如 果 按 照 有 序 的 思路 去 计算 我 们 想 要 的 牌 型 的 个 
数 , 并 让 这 个 结果 除 以 ( 


要 混用 . 


是 场 灾 


任 . 如 果 以 有 序 玫 


纪 ), 即 从 50 张 牌 中 无 序 地 选 出 3 张 牌 的 方法 数 , 那么 这 将 


F 始 , 那么 必须 以 有 序 结束 , 反之 亦 然 . 
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扑克 牌 是 最 流行 的 社交 纸牌 游戏 之 一 , 从 ESPN 的 电视 赛事 转播 到 《星际 迷 


航 : 下 一 代 》 中 企业 号 D 的 工作 之 余 , 它 无 处 不 在 . 我 们 走向 其 为 一 面 , 看 一 些 不 
同 的 单 人 纸牌 游戏 . 流行 的 (或 不 怎么 流行 的 ) 游戏 玩法 有 上 百 种 . 我 们 通常 使 用 


昌 目 标 与 A 牌 


训 无 疑问 ， 接 下 来 我 们 会 看 到 单 人 纸牌 理论 中 最 重要 的 问题 : 赢 的 概率 是 多 


(或 在 A 牌 上 构建 的 东西 ) 有 关 


少 ? 事实 上 , 这 是 个 非常 难 的 问题 , 但 至 少 可 以 着 手 分 析 . 玩 单 人 纸牌 的 绝 大 多 数 人 


本 发 时 间 , 所 以 启 也 许 并 不 是 最 重要 的 事情 . 一 个 更 好 的 问题 或 许 是 : 能 
找到 一 个 有 趣 且 令 人 愉快 的 游戏 的 概率 是 多 少 ? 你 可 以 想象 到 量化 这 个 问题 简直 
是 一 场 亚 梦 , 所 以 我 们 将 坚持 考察 廉 的 概率 ! 


关于 如 何 玩 这 些 游戏 , 你 可 以 花 几 分 钟 时 间 去 查阅 互联 网 , 得 到 的 信息 会 比 想 
要 的 还 多 (比如 , 这 些 游戏 的 历史 , 社会 的 资助 以 及 自动 解决 这 些 问 题 的 程序 , 等 


等 ) 我 


门将 简要 地 描述 下 面 的 游戏 , 但 只 是 简单 地 介绍 一 下 . 希望 你 有 玩 这 些 游戏 


的 经 验 . 如 果 没 有 , 那么 实际 的 规则 和 目标 不 太 重 要 , 宽泛 的 概述 就 足够 了 . 因此 ， 


我 们 不 会 描述 所 有 的 操作 , 有 时 只 给 出 问题 的 部 分 答案 , 你 可 以 上 网 获取 更 多 信息 . 


3.3.1 “克朗 代 克 纸牌 


最 常见 、 最 流行 的 单 人 纸牌 游戏 之 一 (至 少 在 微软 纳入 《空当 接龙 》 之 前 ) 被 
称 为 “克朗 代 克 ”(Klondike 或 patience). 它 有 很 多 种 玩法 . 所 有 玩法 的 初始 设置 都 
是 一 样 的 .纸牌 被 分 成 了 7 组 , 每 组 牌 都 正面 朝 下 登 放 在 一 起 . 第 1 组 有 1 张 牌 ， 
第 2 组 有 2 张 牌 , 依次 类 推 , 第 7 组 有 7 张 牌 . 然后 , 我 们 把 每 一 组 顶端 的 牌 翻 过 


站 


来 . 这 就 需要 28 张 牌 . 剩 下 的 24 张 牌 放 在 一 起 , 稍 后 我 们 将 讨论 它们 的 用 途 . 如 
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图 3-4 所 示 . 


+ 吕 史 
全 中 300| 上 SA 
“oy 00| mA | RS 
00) JMA oh 
全 国民 让。 
一 vvy 


图 3-4 ”克明 代 克 纸牌 游戏 的 初始 状态 . 图 片 来 自 维基 百科 , 由 用 户 Andreas Rosdal 发 布 


顶部 有 4 个 基 牌 位 置 . 当 出 现 一 个 A 牌 时 , 就 把 它 挪 到 一 个 基 牌 位 置 上 , 这 样 
基 牌 位置 上 就 有 了 一 张 A. 在 得 到 一 张 A 牌 后 , 你 可 以 把 同 种 花色 且 点 数 为 2 的 
牌 放 在 A 的 上 面 . 之 后 , 你 可 以 继续 把 同 种 花色 且 点 数 为 3 的 牌 放 在 2 的 上 面 , 依 
此 类 推 . 我 们 的 目标 是 把 全 部 52 张 牌 都 放 到 4 个 基 牌 位 置 上 . 

对 于 任意 一 张 显露 牌 (正面 朝 上 ), 如 果 另 外 一 组 的 显露 牌 与 其 颜色 不 同 且 点 
数 多 1, 那么 这 张 显 露 牌 就 可 以 挪 到 该 组 中 去 . 在 图 3-4 所 描述 的 游戏 中 , 我 们 可 以 
把 黑 桃 Q 移动 到 方块 K 上 , 也 可 以 把 黑 桃 7 移 到 方块 8 上 . 当 牌 被 移动 之 后 , 你 
就 可 以 把 它 下 面 的 那 张 牌 翻 过 来 . 如 果 有 一 组 牌 空 了 , 那么 你 可 以 把 一 张 显露 的 K 
牌 (或 从 下 牌 开 始 的 一 串 牌 ) 移 到 这 个 位 置 上 . 

关于 剩 下 的 24 张 牌 该 如 何 使 用 , 有 很 多 不 同 的 规则 . 一 种 常见 的 做 法 是 循环 
浏览 它们 ; 每 次 浏览 3 张 牌 , 并 把 第 3 张 牌 显露 出 来 . 对 于 每 一 张 显露 牌 , 你 可 以 
选择 把 它 放 在 基 牌 位 置 上 (如 果 可 以 的 话 ), 或 者 放 在 某 个 空 组 的 位 置 上 (如 果 有 的 
话 ), 又 或 者 把 它 放 到 某 组 的 显露 牌 上 . 

我 们 的 主要 问题 是 廉 的 概率 有 多 大 , 但 还 存在 一 些 其 他 问题 有 多 少 种 可 能 的 
牌 局 ? 一 种 回答 是 有 52! 种 , 但 如 果 考 虑 等 价 类 , 结果 就 更 少 了 . 例如 , 把 所 有 的 红 
桃 都 换 成 方块 , 这 在 本 质 上 并 没有 发 生变 化 .……… 

接 下 来 , 我 们 集中 精力 考察 获胜 这 件 事 . 由 于 问题 的 复杂 性 , 我 们 无 法 给 出 完 
整 的 分 析 . 计算 机 检索 和 计算 机 辅助 证 明 告 诉 我 们 , 超过 80% 的 牌 局 是 有 机 会 赢 
的 , 至 少 有 8% 的 牌 局 是 不 可 能 最 的 . 那 剩 下 的 呢 ? 嗯 , 我 们 还 需要 做 很 多 工作 . 还 
存在 一 大 类 开放 型 的 牌 局 . 

有 些 牌 局 非常 糟糕 , 把 它们 与 不 可 能 启 的 牌 局 放 在 一 起 是 非常 不 合理 的 . 还 有 
0.25% 的 牌 局 糟 透 了 , 不 存在 任何 有 效 移动 . 这 些 牌 局 被 称 为 不 可 玩 牌 局 , 它们 形成 
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了 一 个 特别 讨厌 的 集合 , 即 不 可 


么 都 做 不 了 的 游戏 ? 


台 已 二 


用 刷 


得 局 的 子 集 . 回想 起 我 们 最 初 的 讨论 , 这 些 不 
可 玩 牌 局 是 完美 的 分 析 对 象 . 它们 不 仅 与 遍 有 关 , 还 与 娱乐 性 有 关 : 谁 想 玩 


场 什 


我 们 试 着 求 出 不 可 玩 牌 局 数量 的 下 界 . 这 并 不 是 去 寻找 最 优 的 下 界 . 相 


可 一 张 牌 . 
那么 ， 


口 


”™ 


门 只 需要 找到 一 个 下 界 强 


因为 


保 在 显露 牌 中 不 会 有 黑色 的 


只 有 


了 红 上 


AAA 


全 


可 以 放 在 黑 牌 上 , 所 以 我 们 


反 , 我 


可 以 了 . 试 着 想象 什么 都 做 不 了 的 状态 . 如 果 每 组 的 显露 
牌 都 是 黑色 的 , 并 且 每 次 循环 的 第 3 张 牌 也 是 黑色 的 , 那么 会 发 生 什 么 ? 这 是 不 可 
玩 牌 局 吗 ? 看 起 来 是 这 样 的 ， 


无 法 移动 任 


A 牌 ， 


有 黑色 的 显露 牌 会 造成 一 个 不 可 玩 牌 局 吗 ? 差不多 是 这 样 ! 我 们 要 确 
因为 2 张 黑 色 的 A 牌 都 可 以 挪 到 基 牌 


攻 


位 站 


这 些小 提醒 在 类 似 的 问题 中 很 常见 ; 很 多 时 候 , 我 们 还 需要 排除 一 些 令 人 讨厌 的 小 


情形 . 


黑 1 


色 脾 . 医 


那么 , 如 何 计算 这 种 不 可 妃 


牧 , 并 把 第 3 张 牌 显露 


;= 


有 15 个 位 置 被 分 配 了 点 数 不 为 A 的 黑 
色 牌 , 其 中 有 24 张 牌 的 点 数 不 是 A. 有 多 少 种 选 法 ? 从 这 24 张 牌 中 选 出 15 张 ， 
有 (325) 种 选 法 . 

现在 怎么 办 呢 ? 在 我 看 来 , 这 就 是 问题 变 得 环 手 的 地 方 , 也 是 讨论 它 的 原因 . 除 


[ 牌 局 的 概率 呢 ? 我 们 必须 选 出 7 张 点 数 不 为 A 的 
色 牌 , 让 它们 作为 7 组 牌 的 显露 牌 . 之 后 循环 浏览 剩 下 的 24 张 牌 
来 . 那么 , 这 里 有 8 张 显 露 牌 , 它们 都 是 
色 牌 . 二 


点 数 不 为 A 的 号 
| 牌 中 有 26 张 黑 


六 3 环 


| 


壮 


a™ 


非 你 已 经 解决 了 大 量 问 题 , 否则 什么 时 候 应 该 考虑 次 序 、 什 么 时 候 不 该 考虑 次 序 是 


很 容易 混淆 的 ， 从 我 们 的 叙述 
我 们 已 经 看 到 , 次 序 在 这 个 游戏 中 是 至 关 重 要 的 . 所 以 我 们 必须 非常 小 心 . 
解决 这 个 问题 的 最 简单 方法 是 从 有 序 的 角度 考察 问题 . 所 有 52 张 牌 
定位 置 , 所 以 要 为 每 个 位 置 安排 一 个 数 . 我 们 以 非 标 准 的 方式 进行 编号 . 第 
2 组 的 显露 牌 . 这 样 


位 置 1, 它 指 的 


可 以 看 出 , 应 该 使 


用 二 项 式 系数 , 它 是 


上 生气 


征 和 外 


即 第 7 组 的 显露 牌 


9( 第 二 张 显露 牌 )， 


直到 


置 , 其 编号 无 关 紧 要 . 
第 一 个 位 置 有 24( 即 24 一 0) 利 


能 的 选择 , 第 三 个 位 置 有 22( 即 24 - 2) 种 可 
10( 即 24 一 14) 种 可 能 的 选择 . 把 这 些 结果 相 
把 它 看 作 24!/(24 一 
次 排 在 剩 下 的 位 置 


1 组 上 


位 置 15( 最 后 一 张 


15)0). 在 看 


的 显露 牌 . 位 置 2 
. 位 置 8 是 剩 下 24 张 牌 


月 和 后 


态 朱 


可 玩 牌 局 


Na 


概率 是 (24!1/9!)37!1/52!， 这 是 


kt 有 37! 种 方法 . 
有 (241/91)37! 种 . 又 因为 己 
EE 有 很 多 大 数 的 阶乘 , 你 要 小 心 , 避免 出 现 溢 出 错误 . 很 


显露 牌 ). 


中 显露 牌 的 第 


Ee 


于 剩 下 的 52 一 15 = 37 个 


E 序 的 . 但 


都 要 被 指 


个 是 
直到 位 置 7， 


个 位 置 , 接 下 来 是 位 置 


、 


DA 


可 能 的 选择 , 第 二 个 位 置 有 23( 即 24 一 1) 种 可 


能 的 选择 , 以 由 
乘 就 得 到 了 24 .23.…10 = 24!/9!( 可 以 
定 了 这 15 张 牌 之 后 , 我 们 还 剩 下 37 张 牌 , 把 它们 依 


因此 , 显露 牌 


类 推 , 第 15 个 位 置 有 


只 能 是 点 数 不 为 A 的 黑 牌 的 不 
《有 52! 种 牌 局 , 所 以 出 现 这 种 不 可 玩 牌 


局 的 
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我 们 还 可 以 用 男 一 种 值得 强调 的 方法 来 


可 答 这 个 问题 . 这 次 


幸运 , Mathematica 能 给 出 答案 . 这 个 概率 是 11/37 701 755, 大 约 是 2.9. 10-5%! 


使 用 二 项 式 . 无 序 


地 选 出 15 张 点 数 不 为 A 的 黑 牌 有 (2 种 方法 . 与 之 前 的 问题 不 同 , 现在 我 


门 把 次 


序 添加 上 . 把 15 张 牌 依次 放 在 15 个 位 置 上 共有 15! 种 方法 . 因此, 选 出 15 张 点 
数 不 为 A 的 黑 牌 并 依次 放 在 15 个 位 置 上 的 方法 数 为 (29)15!( 即 24!y9!, 与 前 面 的 


结果 相同 ). 那么 从 52 张 牌 中 有 序 地 挑选 
15 张 牌 有 (33) 种 方法 , 然后 对 它们 排序 有 15! 种 方法 . 
局 概率 是 (( 色 )151)/(( 吕 )15!). 注意 , 15! 是 可 以 消 
的 , 这 样 就 得 到 了 (2 /( 弛 , 即 11/37 701 755, 与 之 前 的 结果 相同 . 
到 了 开始 的 地 方 . 但 这 次 并 没有 


为 A 的 15 张 黑 牌 的 不 可 玩 牌 


这 很 有 趣 , 我 们 又 [E 


上 15 张 牌 有 多 少 种 方法 ? 无 序 地 


人 
给 出 


因此 , 显露 牌 只 能 是 点 数 不 


挑选 出 


我 们 得 到 的 是 两 个 二 项 式 系数 的 比值 . 这 似乎 是 种 更 干净 、 


四 个 阶乘 和 两 个 除法 ， 
更 好 的 书写 方式 . 仔细 


挥 


观察 一 下 , 我 们 可 以 由 (24!1/91)371/52! 得 出 上 面 的 结果 . 我 想 让 你 知道 该 怎样 去 做 ， 


因为 这 些 代数 运算 可 以 很 好 地 展示 整个 变化 过 程 . 


认真 看 看 (24!/90)37!/52!， 再 想 想 二 项 式 系数 ， 现 在 有 
们 人 迫切 需要 15!， 让 它们 乘 以 1( 这 是 我 最 喜欢 的 技巧 之 一 , 更 多 内 容 请 参阅 A.12 


个 24! 和 一 个 9 


我 


节 ). 在 乘 以 1 = 15!/15! 之 后 , 我 们 就 得 到 了 (24!/91150151371/52!. 奇迹 就 这 样 发 生 
了 一 一 注意 15 加 37 等 于 52, 于 是 我 们 真 的 找到 了 第 二 个 二 项 式 系数 . 乘 以 1 可 


因子 扣 


以 让 我 们 重 写 代数 表达 式 , 这 极 好 地 曾 明 了 答案 . 根据 a/5 = 1/(b/a), 我 们 可 以 把 
Fh 到 分 母 上 , 这 样 就 得 到 了 (24!/9!150/(521/151370. 我 们 还 可 以 选择 这 些 二 项 


式 系数 的 写法 . 第 一 个 二 项 式 系数 可 以 写成 (2， 或 (2, 第 二 个 可 以 写成 (加 ) 或 


(52). 哪个 是 更 好 的 选择 显而易见 . 我 们 应 该 选择 有 数 15 的 写法 , 因 
因此 , 我 们 可 以 由 第 一 种 方法 得 到 (2 /(52)， 此 外 , 这 很 好 


式 子 在 形式 上 更 相似 . 
地 从 组 合 学 角度 解释 了 我 们 所 做 的 事 . 


要 黑 牌 和 红牌 的 点 数 不 相 邻 , 我 们 就 可 以 


3.3.2 ”Aces Up 纸牌 


我 最 喜欢 的 单 人 纸牌 游戏 之 一 是 Aces Up 纸牌 . 它 的 玩法 是 这 样 的 : 洗 牌 ， 


上 的 链接 . 


为 这 能 使 两 个 


这 个 值 相当 小 , 远 远 小 于 0.25%. 我 们 还 能 做 得 更 好 吗 ? 当然 能 , 可 以 让 它 加 
党 . 该 怎么 做 呢 ? 黑色 没有 什么 特别 之 处 , 我 们 可 以 看 看 只 有 红牌 的 情形 . 
好 的 , 我 们 已 经 得 到 了 5.8 .10-5%, 但 这 与 0.25% 还 有 
的 是 , 我 们 走 得 越 远 , 情况 就 越 复 杂 . 真正 的 难题 是 黑 牌 和 红牌 同时 出 现 的 情况 . 
同时 考虑 两 种 颜色 . 作为 一 个 很 好 的 练习 ， 
你 尽 可 能 地 去 提高 这 个 概率 值 , 并 尽量 选择 较 简 单 的 计算 方法 . 想 要 了 解 更 多 信息 ， 
请 查看 维基 百科 关于 “克朗 代 克 纸牌 ”页 面 


很 大 的 差距 . 令 人 难过 


口 


~、 


然后 给 出 4 张 正 面 朝 上 的 牌 . 假设 你 现在 有 4 组 牌 . 对 于 任意 一 组 的 顶 牌 , 如 果 它 
与 另外 某 组 项 牌 的 花色 相同 但 点 数 较 小 , 那么 就 把 这 张 牌 放 到 弃 牌 堆 里 . 例如 , 假 
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设 这 4 组 牌 的 顶 牌 分 别 是 4%、39、6@ 和 20, 那么 就 可 以 把 20 移 到 弃 牌 堆 里 . 如 
果 在 20 的 下 面 还 有 一 张 牌 , 那么 这 张 牌 就 成 为 该 组 的 顶 牌 ; 如 果 2 的 下 面 没有 
牌 , 那 就 得 到 了 一 个 自由 组 , 任何 一 张 顶 牌 都 可 以 挪 到 这 个 自由 组 上 . 游戏 的 目标 
是 最 终 只 剩 下 4 张 A 牌 .( 很 明显 , 我 们 不 可 能 得 到 更 好 的 结果 ! ) 

随 着 不 断 地 成 长 , 我 从 别人 那里 了 解 到 : 当 最 后 只 剩 下 10 张 或 者 更 少 张 牌 时 ， 
赢 的 概率 会 非常 大 ; 如 果 最 后 能 得 到 4 张 A 牌 , 那 就 赢 了 . 我 曾经 连续 几 个 小 时 
玩 这 个 游戏 , 但 有 件 事 总 是 让 我 觉得 很 烦 . 我 知道 任何 纸牌 游戏 都 跟 运 气 有 关 , 但 
这 个 游戏 似乎 受 运气 的 影响 特别 大 . 换 句 话说 , 不 管 使 用 多 么 巧妙 的 方法 (我 觉得 
自己 很 擅长 这 种 游戏 ! ), 我 还 是 经 常 输 ! 虽然 有 时 输 得 很 惨 , 但 知道 了 概率 法 则 后 ， 
有 很 多 次 我 都 能 一 直 很 好 地 玩 到 最 后 . 
是 如 何 做 到 的 呢 ? 不 难看 出 , 在 刚 开 始 时 , 只 保留 3 组 牌 是 很 容易 做 到 的 , 但 
到 第 40 张 牌 时 , 每 种 花色 的 牌 都 至 少 出 现 了 一 张 . 从 此 刻 起 , 会 始终 有 4 组 牌 , 所 
以 你 至 少 能 看 到 4 张 牌 . 这 就 是 铝 梨 原理 (如 果 你 没 听 过 这 个 美妙 的 理论 以 及 它 的 
深远 影响 , 请 参阅 A.11 节 的 简要 讨论 ). 

最 糟 的 情况 可 能 是 最 后 4 张 牌 的 花色 各 不 相同 . 为 什么 呢 ? 当 发 生 这 种 情况 时 ， 
我 们 不 可 能 把 任何 牌 移 到 弃 牌 堆 里 . 如 果 你 足够 幸运 , 那么 只 需要 8 张 牌 , 就 能 得 
到 4 张 A 牌 (其 中 4 张 是 最 终 剩 下 的 4 张 A 牌 ,另外 4 张 是 将 被 丢弃 且 花 色 各 不 
相同 的 4 张 牌 ). 如 果 有 更 多 牌 , 那么 情况 就 变 糟 了 ! 

类 似 于 对 克朗 代 克 纸牌 的 讨论 , 我 们 不 去 计算 实际 的 失败 概率 . 我 们 会 把 注意 
力 集中 在 一 种 特殊 情形 上 , 这 又 是 个 相当 恼人 的 失败 类 型 . 在 克朗 代 克 纸牌 中 , 我 
们 把 失败 的 牌 局 称 为 不 可 玩 的 , 这 里 则 称 之 为 不 可 移动 的 , 因为 最 后 4 张 牌 无 法 挪 
动 并 不 是 我 们 的 错 . 
出 现 不 可 移动 牌 局 的 概率 是 多 少 ? 换 句 话说 , 最 后 4 张 牌 的 花色 各 不 相同 的 
概率 有 多 大 ? 发 生 这 种 情况 的 概率 是 不 是 已 经 大 到 了 我 们 应 当 找 男 一 种 纸牌 游戏 
来 玩 的 地 步 (幸运 的 是 , 这 类 游戏 有 很 多 ! ), 还 是 说 它 的 概率 很 小 , 完全 不 用 为 此 
担心 ? 显然 , 对 这 些 问题 的 回答 取决 于 你 的 个 人 喜好 . 我 们 所 能 做 的 就 是 计算 得 到 
4 张 花色 各 不 相同 的 牌 的 概率 . 

从 52 张 牌 中 无 序 地 选 出 4 张 牌 有 (党 ) = 270 725 种 方法 , 但 从 52 张 牌 中 依次 
选 出 4 张 牌 就 有 52.51.50.49 = 6 497 400 种 方法 . 显然 , 我 们 不 打算 考察 所 有 可 
能 的 情况 ! 

我 们 要 从 每 种 花色 中 选 出 一 张 牌 : 把 4 种 花色 依次 排序 共有 4 = 24 种 方法 (从 
和 DO 刘 到 各 Oh); 对 于 每 一 种 花色 , 从 中 选 出 一 张 牌 的 方法 有 13 种 . 因此 , 在 考虑 
次 序 的 前 提 下 , 选择 4 张 花色 各 不 相同 的 牌 有 4!1.134 = 685 464 种 方法 . 换 句 话说 ， 
出 现 不 可 移动 牌 局 的 概率 大 约 为 10%(685 464/6 497 400= 2197/20 825~~ 0.105 498). 
这 比 克朗 代 克 纸牌 中 的 0.25% 更 糟糕 . 10% 是 相当 重要 的 ; 记 住 , 这 只 是 失败 概率 
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的 一 个 下 界 . 


我 们 可 以 用 另 一 种 方法 来 计算 . 在 不 考虑 花色 次 序 的 情况 下 ， 再 看 看 这 个 问 


题 . 对 于 第 一 张 牌 , 我 们 可 以 选择 52 张 牌 中 的 任何 一 张 牌 , 共有 ( 吕 


法 . 第 二 张 可 以 是 任意 一 张 花色 不 同 的 牌 , 因此 第 二 张 牌 有 (33) = 39 种 选 法 . 


样 地 ， 第 三 张 


张 牌 有 (3) = 


52 种 选 


同 


的 花色 与 前 两 张 的 不 同 , 所 以 它 有 (3 = 26 种 选 法 ， 最 后 , 第 四 


13 种 选 法 ， 注 意 ，( 字 )(”)() (了 ) = 685 464 恰好 等 于 之 前 的 结 


果 ! 然后 , 让 这 个 结果 除 以 有 序 地 选 出 4 张 牌 的 方法 数 ， 就 得 到 了 与 前 面 一 样 的 


答案 . 


每 个 箱子 里 都 有 13 张 相同 花色 的 牌 , 我 们 需要 从 每 个 箱子 中 选 出 一 张 牌 . 对 了 
个 箱子 , 从 中 选 出 一 张 牌 有 13 种 方法 ; 因此 , 挑选 出 4 张 花色 各 不 相同 的 牌 共 
134 = 28 561 种 方法 . 需要 注意 的 是 , 这 种 方法 是 不 考虑 次 序 的 . 换 名 话说, 没有 


还 有 另 一 种 计算 这 个 结果 的 方法 ! 这 个 问题 与 下 列 叙 述 等 价 : 共有 4 个 箱子 ， 


说 黑 桃 是 第 一 个 还 是 第 四 个 被 选 出 来 的 , 只 是 说 选 出 了 一 张 黑 桃 . 从 52 张 牌 中 无 
序 地 选 出 4 张 牌 有 ( 鸣 = 270 725 种 方法 . 因此 , 每 种 花色 的 牌 各 有 一 张 的 概率 是 
28 561/270 725= 2197/20 825, 这 恰好 与 之 前 的 结果 相等 ! 

启发 : 虽然 分 析 游 戏 的 获胜 概率 是 一 件 很 有 趣 的 事 , 但 我 如 此 喜欢 这 个 问题 


是 因为 它 让 你 知道 了 , 计算 出 正确 答案 的 方法 不 止 一 种 . 实际 上 , 解决 这 个 问题 的 


方法 至 少 有 3 种 ! 两 种 方法 是 计算 4 张 牌 的 有 序 序列 的 个 数 , 但 第 三 种 方法 则 是 


从 无 序 的 角度 来 考察 的 . 只 要 你 够 小 心 , 就 可 以 采用 多 种 方法 来 解决 一 个 问题 . 


然 , 重要 的 是 要 记 住 , 不 能 混用 和 胡乱 匹配 : 如 果 分 子 是 由 满足 条 件 (每 种 花色 各 
有 一 张 ) 的 4 张 牌 所 组 成 的 有 序 集 个 数 , 那么 分 母 就 应 该 是 


法 数 . 


附加 问题 : 顺便 说 一 下 , 多 一 点 检查 会 带 来 更 多 有 趣 的 问题 (并 且 能 了 解 至 


是 一 场 难 以 获 朋 


MI 


依次 选 出 4 张 牌 的 方 


| 这 


的 游戏 ). 如 果 最 后 4 张 牌 或 者 之 前 的 4 张 牌 是 同一 花色 , 那 就 很 
难 获胜 了 . 发 生 这 种 情况 的 概率 是 多 少 ? 它 应 该 在 20% 左右 . 另 一 种 难以 处 型 


的 


情况 是 , 虽然 没有 4 张 相同 花色 的 牌 , 但 点 数 最 大 的 黑 桃 有 可 能 放 在 其 余 黑 桃 之 上 ， 


等 等 . 这 些 事件 的 概率 是 多 少 ? 
3.3.3 《空当 接龙 》 


如 果 没 有 简要 地 介绍 过 《空当 接龙 》, 那么 对 单 人 纸牌 游戏 的 讨论 就 是 不 完整 
的 . 这 个 游戏 的 变 体 可 以 追溯 到 20 世纪 20 年 代 . 虽然 它 在 1978 年 有 一 个 计算 机 


版 本 


es 


由 Paul Alfille 为 柏拉图 系统 而 设计 ), 但 真正 重要 的 里 程 碑 是 20 世纪 90 


人 年 


代 初 , 微软 在 Win32s 中 引入 了 这 个 游戏 . 从 那 时 起 , 《空当 接龙 》 就 在 数 百 万 台 机 


咒 上 安 效 好 了 ， 


玩 这 个 游戏 . 


并 且 可 以 随时 使 用 . 无 数 的 用 户 都 曾 花费 (也 许 是 浪费 ? ) 数 小 时 来 
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我 们 将 概述 如 何 安装 以 及 玩 这 个 游戏 ， 


《空当 接龙 》 的 帮 
列 7 张 牌 , 另外 4 
牌 都 放 在 4 个 基 牌 


A 


助 ). 所 有 有 牌 都 是 正面 
列 是 每 列 6 张 牌 . 这 个 游戏 的 目 
位 置 上 . 当然 , 明 


种 


2 


FE 的 ; 它们 被 


多 内 容 请 参阅 维基 百科 (或 微软 关于 


分 成 了 8 列 , 其 中 4 列 是 每 


你 了 解 这 些 , 那 很 好 ; 如 果 不 了 解 ， 
信息 . 我 们 的 目标 不 是 对 游戏 进行 
会 出 现 重复 计数 的 问题 . 


也 不 


全 面 F 


月 


接 下 来 , 我 们 将 集 


讨论 是 否 每 个 牌 局 都 是 可 


游戏 设置 , 所 以 不 同 的 人 可 以 分 至 


除了 编号 为 11 982 的 牌 局 之 外 , 所 有 的 牌 局 都 被 解决 了 . 在 后 来 的 100 万 个 此 
(前 32 000 个 牌 局 和 以 前 一 样 ), 只 有 下 列 编号 的 短 


186 216、455 889、495 505、512 11 


玩 同 一 牌 局 的 乐趣 . 


| 


局 没 
8、517 776 和 7 


标 与 克朗 代 克 纸 讲 
bP 些 牌 可 以 移动 以 及 何 时 移动 是 有 规定 的 . 如 果 
日 担心. 如果 有 兴趣 , 你 可 
的 分 析 , 而 是 用 这 个 游戏 来 强调 一 不 小 心 就 


解 的 . 微软 的 程序 保存 了 最 初 的 


81 948. 虽然 这 不 是 一 个 训 


| 


相似 , 希望 把 


以 上 网 查阅 更 多 


在 最 初 的 32 000 个 牌 局 中 ， 
泉 局 中 
能 被 解决 : 11 982、146 692、 


E 明 ,1 


从 这 100 万 个 数据 来 看 , 差不多 所 有 的 有 牌 局 都 是 


] 解 的 ; 不 管 怎么 说 , 这 个 概率 比 


我 们 在 Aces Up 纸牌 和 克朗 代 克 纸牌 中 看 到 的 情况 要 好 得 多 . 
显然 , 如 果 你 不 知道 游戏 规则 , 那么 下 面 的 讨论 可 能 就 有 点 难以 理解 . 不 过 , 你 
只 需要 相信 下 面 这 些 牌 会 导致 一 个 不 可 解 的 牌 局 就 行 了 . 我 从 Hans Bodlaender 的 
网 页 上 抓 取 了 这 组 牌 , 它 发 布 于 1996 年 7 月 12 日 (星期 五 ) 的 16:18:16 MDT. 
2 2% 20 29 Ah Au AO AQ 
8@ 8 80 59 7@ 7®% 70 79 
K@ K® KO KY 60 69 6@ 6g 
QO QV Q@ Q& 5@ 5% 50 59 
J 了 区 JO JV 40 4 4 多 人 域 
100 109 10@ 10& 3 3 30 39 
9@ 9 各 90 99 


重 ! 
们 要 把 红牌 ( 红 桃 9 和 方块 人) 提 
所 有 的 梅花 都 换 成 黑 桃 , 并 把 所 有 


的 组 


出 | 


| 


可 解 的 . 另外 , 我 们 不 用 换 掉 所 有 
换 J@ 和 J 昌 , 或 者 50 和 59). 
这 自然 引 蝇 


rT 


上 了 一 个 问题 : 通过 简 六 


晶 


》 


胜 的 牌 局 ? 这 个 问题 可 以 从 多 个 了 


会 有 重复 计数 的 危险 . 
首 
26 对 牌 , 我 们 得 到 了 225 种 牌 局 . 


E, 我 们 有 26 对 点 数 一 样 的 同 1 


次 , 我 们 可 以 改变 列 的 次 序 . 列 的 排序 方法 有 4 4! 种 ， 


修改 上 面 这 组 牌 , 我 们 
9 度 来 考察 ， 当 试图 提 


色 牌 ， 每 对 牌 都 有 两 利 


遍 , 我 们 不 会 详细 讨论 这 个 游戏 是 怎么 玩 的 . 与 克朗 代 死 纸牌 类 似 , 我 
E 到 黑 脾 上 ( 黑 桃 和 梅花 和 ), 反之 亦 然 . 如 果 把 
[ 桃 都 换 成 方块 , 那么 
J] 以 只 把 菜 些 点 数 的 花 1 


用 这 个 牌 局 仍然 是 不 
色 进 行 交 换 (比如 , 交 


能 得 到 多 少 个 无 法 获 
所 有 可 能 的 结果 加 起 来 时 ， 


排列 方法 , 考虑 所 有 


因为 前 4 列 有 4! 利 
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排序 方法 , 后 


如 果 把 前 两 列 中 所 有 点 数 一 样 的 同色 牌 
么 这 组 牌 就 又 回 到 了 初始 状态 . 这 引发 了 对 习 


4 列 也 有 4 种 排序 方法 . 然而 , 某 些 列 交 换 与 行 交换 是 相同 的 . 例如 ， 


都 进行 交换 , 然后 
E 复 计数 的 担忧 . 


交换 这 两 列 


的 位 置 , 那 


事实 证 明 , 当 我 们 考虑 所 有 可 能 的 交换 时 , 具有 相同 点 数 和 颜色 的 列 是 无 法 区 


分 的 . 将 两 对 无 法 区 分 的 元 素 进行 排序 有 6 种 方法 


BABA 和 BAAB). 同样 地 , 对 后 4 列 排序 也 有 6 种 方法 . 于 是 , 如 


的 方法 也 有 6 .6 种 . 


重新 排列 所 有 行 和 列 的 方法 有 226 .6.6= 2415 919 104 种 . 


来 很 大 , 但 与 


总 的 牌 

正如 你 所 看 到 
们 之 间 有 依赖 性 , 所 以 我 们 不 能 只 使 有 
学 到 独立 性 时 , 我 们 会 谈 到 更 多 相关 内 容 , 但 目 
调整 而 产生 的 无 法 获胜 的 牌 局 数 是 微不足道 的 ; 但 
题 是 所 有 问题 中 最 重要 的 . 依赖 性 真 的 很 容易 忽略 . 你 必须 时 刻 保持 警惕 , 避免 重 


复 计数 


3.4 


桥 


牌 


KE (AABB、 ABAB、 ABBA、 BBAA.、 
E 新 对 列 进行 排序 


虽然 这 个 数 看 起 
局 数 52! 相 比 , 这 个 值 还 是 很 小 的 , 其 中 52! 大 于 8 . 1057. 

的 , 并 不 是 所 有 的 列 变换 都 可 以 与 所 有 的 行 变换 相 结 合 . 1 
乘法 法 则 把 所 有 可 能 性 乘 起 来 . 当 在 第 4 章 
前 最 好 小 心 谨慎 一 些 . 由 这 些 细微 


于 它 


是 , 我 们 在 计数 过 程 中 遇 到 的 问 


我 的 家 人 都 非常 爱 玩 纸牌 游戏 , 我 和 孩子 们 将 继续 沿袭 这 个 传统 . 我 最 喜欢 的 


游戏 之 一 是 桥牌 , 它 是 我 成 功 
林 斯 顿 大 学 读 研究 生 时 , 校内 


联盟 是 由 


赛季 结束 时 , 两 支 研究 生 队 打 成 了 平手 , 并 没有 人 费心 举办 最 后 一 场 比 赛 去 决定 谁 
是 冠军 . 不 过 , 假如 真 的 举办 了 最 后 一 场 的 话 ， 


涉足 校内 体育 运动 的 唯 


本 科 生 饮食 


意思 的 是 , 这 个 队 的 队长 是 阿 德里 安 


局 的 概率 . 


的 队 


现在 的 相关 图 
结 出 足够 的 规则 来 了 解 发 生 了 什么 ， 


就 我 们 的 有 


我 们 


AAA 


项 目 . 有 趣 的 是 , 当 我 在 普 
乐 部 和 研究 生 学 院 组 成 的 . 在 


队 肯 定 会 被 男 一 队 彻 底 击败 ; 有 


班 纳 , 他 正 是 《普林斯顿 微 积分 读本 》 的 作 


并 完全 和 忽 


惯例 ; 我 们 没 办 法 


胜 . 拥有 将 牌 


标 而 言 , 需要 了 解 的 是 , 一 共有 
五 且 每 队 有 两 人 , 每 个 人 都 随机 1 
通过 叫 牌 来 决定 是 否 把 茶 个 特别 的 花色 指定 为 将 牌 ( 叫 有 牌 
用 几 段 内 容 描述 清楚 , 所 以 不 再 袭 述 ). 
尽 可 能 多 的 墩 来 获胜 . 四 人 轮流 打出 一 张 牌 就 是 一 墩 ; 在 
出 牌 ， 剩 下 的 玩家 按照 顺 时 针 方向 依次 出 牌 ， 在 每 一 墩 中 , 打出 最 大 牌 


的 优势 在 于 ， 如 果 你 手 


PP 没有 同 花 色 的 牌 ， 可 以 打 昌 


四 人 参赛 , 他 们 分 别 来 
抽取 13 张 牌 ， 玩 家 们 要 
的 过 程 相当 复杂 , 有 很 多 


地 从 一 副 标 准 牌 


都 在 研究 桥牌 , 我 们 怎么 可 能 没 几 个 问题 呢 ? 我 们 将 快速 地 总 
各 如 何 叫 牌 , 而 是 专注 于 确定 各 种 牌 


目 两 个 不 同 


我 们 的 目标 是 通过 电 得 


-一 墩 中 获 有 


和 的 玩家 先 


的 玩家 获 


1 将 牌 来 赢得 这 
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一 墩 . 


要 的 . 


因此， 如果 有 将 牌 的 话 ， 了 解 对 手 
如 , 当 对 手 手中 有 很 多 将 牌 时 , 他 手中 另外 三 利 
在 早 些 时 候 打 出 将 牌 并 获胜 . 因此 ,估算 对 手 拥 


FF 中 都 有 哪些 牌 就 变 得 


例 


非常 重要 了 . 


h 花 色 的 有 牌 就 会 更 少 , 所 以 更 有 可 能 


我 们 先 计算 一 下 有 多 少 利 
重要 问题 . 我 们 将 给 出 两 种 不 同 的 计算 方法 ， 


3.4.1 “ 井 字 游戏 


这 样 做 是 有 充足 理 


配给 四 个 玩家 . 相 比 之 下 , 才 


和 不同 的 牌 局 , 然后 i 


有 一 定数 量 将 牌 的 概率 是 至 关 重 


半 查 将 牌 是 如 何在 对 手 之 间 分 配 的 


通过 考察 井 字 游戏 (也 被 称 为 画 圈 打 叉 游 戏 ) 来 分 析 桥 牌 看 起 来 有 


并 试 着 调和 两 者 的 激烈 冲突 ! 


学 ， 


些 奇 怪 , 但 


况 , 然后 再 继续 讨论 桥牌 . 


的 .桥牌 很 复杂 .虽然 不 考虑 叫 


牌 , 但 它 还 涉及 把 52 张 牌 分 
F 字 游戏 就 简单 多 了 . 在 世界 各 地 的 游乐 场 上 , 孩子 们 
都 在 玩 这 个 游戏 (但 还 不 清楚 它 是 否 为 小 学 水 平 以 上 的 人 月 
个 游戏 来 了 解 一 些 基 本 情 


喜爱 ). 我 们 先 通 过 这 


在 井 字 游 戏 中 , 玩家 轮流 把 X 和 O 放 在 3 x 3 的 网 格 中 . 首先 把 三 个 相同 标 


记 连 成 一 条 线 (横向 、 纵 


可 或 对 角 ) 的 玩家 获 朋 


E. 如 果 没 人 做 到 这 一 点 , 那么 比赛 就 


是 平局 . 图 3-5 是 一 个 井 字 游戏 的 例子 , 其 中 X 先 放 . 
XxX X X|X 又 |X|O X | X|O 
O O O O|xXx 
O X | 0 X | O X|0o |xX 
X|X|O 又 |X|O X|X|O X | XI|O 
O | X O | X O | XI|O O | XI|O 
图 3-5 
那么 , 井 字 游戏 有 多 少 种 可 能 的 棋局 呢 ? 对 这 个 问题 的 回答 要 比 你 想象 中 困 


难 很 多 . 我 
个 , 第 三 步 有 7 个 , 依 贞 
棋局 数量 够 多 了 , 足够 人 


门 很 容易 求 出 棋局 数量 的 上 界 . 第 
E 有 9! 即 362 880 种 


类 》 


也 们 玩 很 长 一 段 时 间 . 


然而 , 这 并 不 是 正月 


的 答案 , 原因 有 两 个 . 首 儿 


步 有 9 个 可 选 的 位 置 , 第 二 步 有 8 


平地 或 垂直 地 翻转 棋盘 , 那么 一 切 都 不 会 发 生 改 变 . 考虑 如 
为 X 位 于 中 心 位 置 ; 但 是 , 第 


棋盘 顺 时 针 旋转 90 度 (第 一 步 看 起 来 和 之 前 一 样 


二 步 O 的 位 是 


从 左下 角 变 成 了 左上 角 )， 


BH 


可 能 的 棋局 . 对 小 孩子 来 说 


E, 如 果 把 棋盘 旋转 90 度 , 抑或 水 


图 3-6 所 示 的 操作 , 把 


这 真 的 是 一 种 不 同 的 棋局 吗 ? 旋转 或 翻转 棋盘 并 不 会 真正 改变 任何 东西 , 所 以 
这 些 不 应 该 被 视 为 不 同 的 . 因此 , 9! 大 大 地 高 估 了 结果 . 


©O 
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O Ox O.xX O|x 
X XxX 又 XxX XxX|xX 
O O 
Ol.x OIlX|X O.X|X O XxX |X 
X|X|oO X|X|oO X|X|0O X .|X|O 
O O O | O OOlIlx 
图 3-6 
第 一 步 有 多 少 种 选择 ? 只 有 三 种 : 中 间 、 一 侧 和 和 角落. 按照 这 种 思路 , 我 们 把 
棋局 的 数量 从 9! 削减 到 3.8!, 这 里 去 掉 了 一 个 因子 3. 还 能 继续 往 下 考虑 吗 ? 当然 
可 以 ! 当 第 一 步 选 定之 后 , 第 二 步 有 多 少 种 可 能 的 选择 ? 我 们 分 三 种 情况 来 考虑 . 


人 


朱 


。 如 果 


一 步 X 选择 中 心 位 置 , 那么 多 


A 
He 


口 右 - 
pa 


步 O 实际 上 


者 一 侧 . 从 这 一 点 开始 , 填 


3 
/可 . 


。 如 果 第 一 步 X 选择 一 侧 的 位 置 , 那么 第 二 步 O 就 有 5 种 
翻转 棋盘 后 , 紧邻 X 的 两 个 角 是 相同 的 , 另外 两 个 角 
了 0 的 2 种 选择 . O 还 可 
,从 文 的 位 置 开始 , 沿 着 对 角 线 还 有 两 条 侧 边 位 置 . 
的 选择 又 多 了 1 个 . 于 是 , 现在 O 有 4 种 可 


入 
价 的 , 所 以 O 
在 X 的 对 面 


还 有 一 条 侧 边 , 那么 第 二 步 O 


满 棋盘 还 有 7! 种 方法 , 所 以 


了 2 种 选择 : 角落 或 
一 共有 2.7!= 10 080 


以 放 在 中 间 位 置 , 那么 现在 


有 5 种 选择 . 


以 我 们 一 共有 5 


最 后 , 我 们 来 考虑 第 一 步 
O 也 有 5 种 选择 (中 心 、 对 角 、 
方法 来 填 满 棋盘 

把 上 面 三 个 结果 加 起 来 , 棋 
这 个 数 仍 然 很 大 , 但 比 最 初 的 9! = 362 880 要 好 多 了 ; 我 们 差不多 去 掉 了 


,所 以 这 种 性 


也 是 一 要 
E 有 了 3 种 选择 . 另 
因为 这 两 条 侧 边 


绕 然 不 同 的 选择 : 
的 ; 这 就 给 


是 


能 的 选择 . 最 后 ， 
在 这 种 情况 下 , 第 


壬 
于 


有 5 种 不 同 的 位 置 可 供 选 择 , 而 完成 接 下 来 的 7 步 有 7! 种 方法 , 所 
.7! = 25 200 种 棋局 . 
巴 X 放 在 角落 的 情况 . 与 上 一 种 情形 类 似 , 第 二 步 
邻 边 、 非 邻 边 和 非 对 角 ), 接 下 来 
4 况 下 的 棋局 数 仍 是 5 7! = 25 200. 
局 的 总 数 不 会 超过 10 800+25 200 十 25 200 = 61 200. 


同样 有 7! 种 


6( 与 之 前 去 挥 的 因子 3 相 比 , 情况 已 经 得 到 了 改善 ). 


我 或 


我 们 已 经 讨论 了 一 个 原 


例子 , 如 
DD 


励 你 继续 分 析 下 去 . 这 里 仍 存在 重复 计算 的 问题 , 对 称 ' 
进 的 机 会 . 然而 , 有 些 事 被 我 们 完 


个 因子 


生 让 我 们 有 继续 改 


2 


忽略 了 . 我 们 说 过 9! 不 是 正 负 


管 案 有 两 个 原因 . 


保 在 7 步 内 获胜 (如 


因 , 即 对 棋盘 进行 旋转 和 翻转 . 另 一 个 原 


图 3-7 所 示 ). 


因 是 什么 呢 ? 不 是 


所 有 的 游戏 都 要 走 完全 程 ! 如 果 有 人 启 了 , 那么 他 通常 会 在 第 9 步 之 前 获胜 . 举 个 
果 你 从 中 心 开始 , 而 你 的 对 手 很 愚蠢 地 选择 了 一 条 侧 边 的 位 置 , 那么 你 可 
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O 

X X|0O X | O X | O 

X X 
O O O O O O O 
O X | O X | O X | O 
X X X X X|X -人 | 关 | 关 

图 3-7 


现在 , 对 这 个 游戏 的 讨论 就 结束 了 
本 书 的 目的 不 是 让 你 成 为 井 字 游戏 
共有 765 种 不 同上 
到 了 一 个 重要 的 事实 . 考察 一 种 性 


上 是 等 价 的 , 它们 


的 王牌 玩家 , 所 以 我 们 不 再 继续 计算 


策略 . 例如 , 假设 你 先 
想 出 每 种 可 能 的 选择 ,3 


失败 . 


下 面 这 个 有 趣 的 问题 与 井 字 游 戏 的 计数 有 关 . 想象 一 下 , | 
只 有 一 个 5 x 5 的 国际 象棋 


E 走 ， 


我 们 没 必要 指出 O 和 XX 的 最 终 位 置 . 


, 只 告诉 你 


的 棋局 , 这 远 小 于 我 们 最 初 的 上 界 362 880. 尽管 如 此 , 我 们 还 是 学 
4 况 的 角度 有 很 多 种 , 有 些 看 起 来 不 同 的 东西 实际 
应 该 被 看 作 一 样 的 . 
下 面 给 出 一 些 与 井 字 游戏 相关 的 问题 : 
的 棋局 (如 有 困难 


(1) 证 明 井 凶 游戏 一 共有 765 种 不 同 
E, 请 查看 维基 百科 页 面 ! ); (2) 依次 找 出 第 一 步 和 第 二 步 的 最 优 
而 你 的 对 手 愚蠢 地 选择 了 一 侧 的 位 置 , 那么 你 就 会 获胜 . 
找到 相应 的 解决 办 法 ， 从 而 保证 不 会 在 任何 一 局 游戏 中 


于 预算 削减 , 我 们 


际 象棋 棋盘 我们 可 以 把 5 个 皇后 放 在 棋盘 上 , 并 保证 3 个 


兵 可 以 安全 地 放置 . 请 找 出 皇后 的 摆 法 ! ( 提示 : 不 要 试 着 找 出 5 个 皇后 的 所 有 摆 


法 , 你 可 以 利用 井 字 游戏 的 思路 来 减少 可 能 情况 . 虽然 这 是 可 行 的 , 但 如 果 你 够 聪 


明 , 就 可 以 找到 一 个 强大 的 等 价 关系 , 从 而 节省 更 多 的 时 间 .) 


3.4.2 ”桥牌 牌 局 的 个 数 


在 上 一 小节 中 , 我 们 计算 了 井 字 游戏 的 不 同 棋局 的 个 数 . 我 们 从 一 个 上 界 9! 即 
362 880 开始 , 然后 说 明了 如 果 旋 转 或 翻转 棋盘 会 导致 相同 棋局 的 出 现 ， 
的 个 数 就 下 降 到 了 不 超过 61 200. 继续 考察 下 去 , 这 个 值 可 以 下 降 到 765( 但 是 , 想 
要 得 到 这 个 数 , 我 们 还 需要 考虑 额外 的 对 称 性 ). 

桥牌 会 是 什么 情况 呢 ? 好 的 , 我 们 有 四 个 玩家 , 每 人 手中 有 13 张 牌 . 


但 是 , 就 像 井 字 游 戏 一 样 , 这 并 不 是 我 们 想 要 的 数 . 


就 是 每 个 玩家 手 
的 ,IE 


中 的 所 有 牌 依次 排序 , 共有 52! 种 方法 , 因此 我 们 有 52! 或 大 约 8. 1057 利 


那么 棋局 


把 一 副 牌 


局 (假设 四 个 玩家 各 不 相同 ). 


不 同 的 牌 


且 牌 局 被 确定 ， 


的 13 张 牌 都 是 什么 , 而 不 是 发 牌 的 次 序 如 何 . 因此 52! 是 错误 
答案 是 什么 呢 ? 第 一 个 玩家 的 13 张 牌 有 ( 吕 ) 种 取 法 ; 第 二 个 玩家 从 剩 下 


最 重要 的 
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的 52 一 13 = 39 张 牌 中 选 出 13 张 有 (13) 种 方法 ; 第 三 个 玩家 有 (23) 种 选 法 ( 记 
住 现在 还 剩 下 26 张 牌 , 我 们 需要 从 中 选 出 13 张 ). 最 后 一 个 玩家 就 没有 任何 选择 
了 一 一 他 只 能 拿 走 剩 下 的 13 张 牌 . 这 与 我 们 考察 的 角度 相 吻 合 , 因为 (] = 1， 
这 表明 了 分 配 最 后 这 13 张 牌 的 方法 只 有 一 种 . 

把 上 述 结 果 相 乘 , 那么 不 同 牌 局 的 个 数 就 是 (也 就 是 说 , 虽然 玩家 是 四 个 不 同 
的 人 , 但 他 们 拿 牌 的 次 序 是 无 关 紧 要 的 ) 

52\ /39\ /26\ /13 
( 和 . ( | ( i | ( | = 53 644 737 765 488 792 839 237 440 000， 

或 约 为 5.103. 这 仍然 是 一 个 巨大 的 数 , 但 比 我 们 原来 的 上 界 小 了 39 个 数量 级 ! 

有 了 上 述 结果 后 , 我 们 来 求 一 些 有 趣事 件 的 概率 . 读本 科 时 , 我 记得 概率 论 课 
本 (道格拉斯 ”G. 凯利 编著 的 《概率 论 导论 》) 里 有 一 段 很 好 的 内 容 , 讲 的 是 完美 
牌 局 . 在 完美 牌 局 中 , 每 个 玩家 都 拿 到 13 张 同 花色 牌 . 因为 偶尔 会 出 现 完美 牌 局 ， 
所 以 我 们 有 必要 考察 得 到 它 的 可 能 性 有 多 大 . 假设 牌 已 经 被 洗 好 , 第 一 个 玩家 有 4 
种 选择 (他 拿 到 的 所 有 牌 具 有 同一 花色 , 可 能 是 黑 桃 、 红 桃 、 方 块 或 者 梅花 ), 接 下 
来 第 二 个 玩家 有 3 种 选择 , 第 三 个 玩家 有 2 种 选择 , 而 最 后 一 个 玩家 只 能 接受 剩 下 
的 1 种 花色 . 因此 , 完美 牌 局 有 4 = 24 种 . 让 这 个 结果 除 以 不 同 牌 局 的 总 数 , 我 人 
得 到 的 概率 将 小 于 10-”3%! 因此 , 出 现 完美 牌 局 确实 令 人 惊叹 (假设 这 些 牌 的 确 很 
好 地 混合 在 了 一 起 ). 要 想 了 解 这 有 多 么 不 可 能 , 请 参阅 3.1.1 节 中 对 阶乘 函数 的 简 
要 分 析 . 假设 有 100 亿 人 在 发 牌 , 每 人 都 是 1 秒 钟 发 完 牌 , 看 看 所 有 人 完成 发 牌 共 
需要 多 少 万 亿 年 ! 
我 所 记得 的 是 , 虽然 出 现 过 许多 完美 牌 局 , 但 从 未 听 说 过 半 完 美 牌 局 . 在 半 完 
美 牌 局 中 , 四 个 人 中 只 有 两 人 的 牌 是 同一 花色 的 . 显然 , 这 意味 着 那些 完美 牌 局 都 
有 可 疑 之 处 . 

我 们 更 进一步 , 考虑 有 一 个 玩家 拿 到 13 张 同 花 色 牌 的 牌 局 数 . 是 否 记 得 在 第 1 
章 里 , 我 们 是 怎样 通过 三 次 尝试 才 提 出 了 正确 的 生日 问题 ? 在 这 里 , 我 们 会 遇 到 类 
似 的 问题 , 这 也 是 选择 这 个 问题 的 另 一 个 原因 . 我 们 并 不 缺少 可 以 计算 的 东西 , 我 
喜欢 这 个 问题 的 原因 是 它 能 提醒 我 们 要 非常 仔细 、 精 确 地 使 用 语言 . 

警告 : 下 面 是 你 见 过 的 最 糟糕 的 计数 ! 我 们 很 容易 在 无 意 中 假设 一 些 条 件 并 
添加 一 些 结构 . 仔细 阅读 下 面 的 内 容 , 注意 保持 警惕 . 在 阅读 的 过 程 中 , 问 问 自己 计 
数 是 否 可 信 , 或 者 是 否 意外 地 添加 了 某 些 次 序 . 当 论 证 结束 时 , 我 们 将 回 过 头 来 再 
次 查看 它们 . 当然 , 既然 我 已 经 警告 你 要 仔细 阅读 下 面 的 内 容 , 那么 应 该 有 个 错误 
有 待 发 现 . 关键 是 , 我 们 很 容易 在 不 知情 的 状况 下 添加 少量 次 序 . 所 以 , 请 睁 大 眼睛 
往 下 读 ! 

言 归 正 传 , 我 们 试 着 计算 一 个 幸运 (或 者 说 不 可 思议 地 幸运 ) 的 玩家 拿 到 13 张 
同 花 色 牌 的 概率 . 选 出 这 个 幸运 的 人 , 有 (9) 种 方法 ; 而 这 个 玩家 恰 有 4 种 牌 型 可 


二 
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以 选择 . 为 什么 ? 他 必须 从 4 种 花色 中 选 出 一 种 , 这 有 (?) = 4 种 选 法 ; 但 是 , 我 们 
最 好 不 要 把 它 看 成 是 由 二 项 式 系数 得 出 的 4 种 方法 , 因为 真实 的 情况 是 从 4 种 花 
色 中 有 序 地 选 出 了 一 种 (关于 这 一 点 稍 后 再 说 ). 那么 剩 下 的 三 个 人 是 什么 情况 ? 把 
其余 的 牌 分 配给 这 三 个 人 的 情况 如 下 : 第 一 个 人 有 ( 吕 ) 种 可 能 的 选择 , 第 二 个 人 有 
(13) 种 可 能 的 选择 , 最 后 一 个 人 有 (13) 种 可 能 的 选择 . 因此 , 有 一 个 玩家 拿 到 13 张 
同 花 色 牌 的 牌 局 总 数 为 (人 (0 (9) (29) (33), 也 就 是 1 351 649 569 165 862 400 或 约 
为 1.3 :10S. 让 这 个 结果 除 以 牌 局 总 数 (大 约 是 5.10”3), 那么 有 一 个 玩家 拿 到 13 
张 同 花 色 牌 的 概率 是 1/39 688 347 475, 或 者 约 为 2.5. 10-11%. 

在 进一步 讨论 之 前 , 我 们 有 必要 了 解 一 种 计算 概率 的 好 方法 . 不 需要 直接 求 出 
上 述 牌 局 的 个 数 , 然后 让 它 除 以 牌 局 总 数 . 为 什么 ? 因为 有 些 因子 可 以 消 掉 . 在 代 
数 运算 之 前 , 如 果 先 把 这 些 因 子 消 掉 , 计算 起 来 就 会 更 加 轻松 , 还 能 降低 溢出 错误 
的 危险 . 这 个 比值 是 


多 人 (Gajda _ 4:4_ 1 
(13)(13)(13)(13) (13) 39 688 347 475 

我 们 已 经 回答 了 一 个 问题 ( 稍 后 会 看 到 我 们 的 答案 是 否 正确 ! ), 但 这 是 我 们 想 
要 回答 的 问题 吗 ? 我 们 想 做 的 是 计算 出 至 少 有 一 个 玩家 拿 到 13 张 同 花 色 牌 的 概率 ， 
还 是 恰 有 一 个 玩家 拿 到 13 张 同 花 色 牌 的 概率 ? 如 果 考 察 的 是 恰 有 一 个 玩家 拿 到 ] 
13 张 同 花色 牌 的 概率 , 那么 就 要 删 掉 有 两 个 人 、 三 个 人 和 四 个 人 拿 到 同 花 色 牌 的 
情况 . 

我 很 喜欢 这 个 问题 . 从 实际 角度 来 看 , 两 种 问 法 并 没有 什么 区 别 , 因为 有 两 个 
或 者 更 多 玩家 拿 到 同 花 色 牌 的 情况 非常 罕见 . 就 这 个 问题 而 言 , 这 并 不 是 个 危险 的 
蕴 误 , 但 对 其 他 问题 来 说 , 情况 就 不 一 样 了 . 因此 , 你 应 该 确保 对 这 些 问题 有 充分 的 
了 解 . 

好 了 , 现在 来 计算 恰 有 一 个 玩家 拿 到 13 张 同 花 色 牌 的 牌 局 数 . 令 人 高 兴 的 是 ， 
不 可 能 出 现 恰 有 三 个 玩家 各 拿 到 13 张 同 花色 牌 的 情况 , 因为 这 将 迫使 最 后 一 个 玩 
家 也 拿 到 13 张 相同 花色 的 牌 . 另外 , 我 们 已 经 知道 , 每 个 玩家 都 拿 到 13 张 同 花 色 
牌 的 牌 局 恰 有 24 个 . 
是 时 候 来 看 一 下 恰 有 两 个 玩家 各 拿 到 13 张 同 花 色 牌 的 牌 局 一 共有 多 少 个 了 . 
选 出 这 两 个 人 的 方法 有 ( 约 = 6 种 . 很 明显 , 选 出 他 们 的 次 序 并 不 重要 , 重要 的 是 被 
选中 的 是 哪 两 个 人 . 你 可 能 认为 接 下 来 要 说 的 是 , 为 这 两 个 玩家 各 分 配 1 种 花色 的 
方法 有 ( 种 , 但 这 是 绝对 错误 的 ! 我 们 已 经 假设 了 玩家 是 四 个 不 同 的 人 , 所 以 哪个 
人 拿 到 哪 种 花色 是 很 重要 的 . 因此 , 为 两 个 玩家 分 配 花色 的 方法 数 就 不 是 ( 约 = 6， 
而 是 4. 3 = 12( 第 一 个 玩家 有 4 种 选择 , 第 二 个 玩家 有 3 种 选择 ). 回忆 一 下 每 个 人 
都 拿 到 13 张 同 花色 牌 的 情况 . 此 时 , 分 配 花色 的 方法 有 一 = 24 种 , 也 就 是 4.3.2.1. 
因此 , 选 出 这 两 个 人 有 人 的 = 6 种 方法 , 而 他 们 可 能 拿 到 的 牌 型 有 4.3 = 12 种 . 这 
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里 的 4.3 可 以 看 作 (3) :2!; 从 4 种 花色 种 取出 2 种 有 (3) 种 方法 , 然后 把 这 两 种 
花色 依次 分 配给 两 个 玩家 有 2! 种 方法 . 

我 们 还 要 把 其 余 的 26 张 牌 分 配给 剩 下 的 两 个 玩家 . 选 出 13 张 牌 分 配给 第 三 
个 人 有 (13) 种 方法 , 那么 第 四 个 玩家 只 能 拿 走 剩 下 的 13 张 牌 (他 从 13 张 牌 中 选 出 
13 张 的 方法 只 有 1 或 (3) 种 ). 所 以 , 分 配 剩 下 的 26 张 牌 共 有 (33) (13) = 10 400 600 
种 方法 . 显然, 这 里 有 个 问题 有 些 分 法 会 导致 四 个 玩家 都 拿 到 13 张 相同 花色 的 
牌 . 我 们 该 如 何 处 理 呢 ? 在 分 配 完 前 26 张 牌 之 后 , 还 剩 下 26 张 牌 . 我 们 必须 从 中 
选 出 13 张 分 配给 第 三 个 玩家 , 这 有 (13) 种 选 法 . 那么 有 多 少 种 分 法 会 使 得 第 三 个 
玩家 也 拿 到 13 张 相同 花色 的 牌 ? 恰 有 2 种 . 有 2 种 花色 的 牌 已 经 全 部 分 配给 了 前 
两 个 玩家 , 所 以 剩 下 的 这 26 张 牌 具 有 2 种 花色 . 因此 , 我 们 要 修改 上 面 的 算法 . 把 
13 张 牌 分 配给 第 三 个 玩家 的 方法 应 该 有 (7?3) 一 2 = 10 400 598 种 , 然后 有 (13) = 1 
种 方法 为 第 四 个 玩家 分 配 牌 . 这 是 个 很 小 却 很 重要 的 变化 . 综 上 所 述 , 恰 有 两 个 玩 
家 各 拿 到 13 张 同 花色 牌 的 方法 数 为 


ER 


如 果 上 述 论证 没有 任何 错误 , 那么 我 们 现在 就 能 求 出 恰 有 一 个 玩家 拿 到 13 
张 同 花色 牌 的 牌 局 数 了 . 只 需要 计算 出 至 少 有 一 个 玩家 拿 到 13 张 同 花色 牌 的 
牌 局 数 ,， 然 后 减 去 有 两 个 或 更 多 个 玩家 都 拿 到 同 花 色 牌 的 牌 局 数 就 行 了 我们 已 
经 求 出 至 少 有 一 个 玩家 拿 到 13 张 同 花色 牌 的 牌 局 数 为 4 .4 . (33) (73)(13) 或 
1 351 649 569 165 862 400. 然后 让 这 个 结果 减 去 恰 有 两 个 玩家 各 拿 到 13 张 同 
花色 牌 的 牌 局 数 ( 即 748 843 056), 接着 再 减 去 所 有 玩家 都 拿 到 13 张 同 花色 牌 的 牌 
局 数 24. 于 是 , 最 终 的 答案 是 1 351 649 568 417 019 320. 这 个 结果 比 原来 的 答案 


当然 , 最 大 的 问题 是 : 我 们 算 对 了 吗 ? 你 有 多 大 的 信心 觉得 我 们 没 犯错 ? 有 没 
有 另外 一 种 解 题 方 法 来 做 检验 ? 幸运 的 是 , 存在 其 他 求解 方法 , 不 妨 一 试 . 我 们 可 以 
对 恰 有 两 个 玩家 各 拿 到 13 张 同 花色 牌 的 论证 进行 修改 . 

下 面 用 另 一 种 方法 来 计算 恰 有 一 个 玩家 拿 到 13 张 同 花色 牌 的 牌 局 数 . 选 出 这 


= 


个 玩家 有 (和 ) 种 方法 , 他 能 拿 到 的 牌 型 有 4 种 (对 应 于 4 种 花色 ). 对 第 二 个 玩家 来 
说 , 他 手中 的 牌 有 (33) 种 可 能 的 取 法 . 在 这 些 取 法 中 , 第 二 个 玩家 拿 到 13 张 同 花 
色 牌 的 取 法 恰好 有 3 种 , 所 以 这 些 取 法 必须 删 掉 ; 因此 , 有 (33) - 3 种 可 能 的 牌 型 
殿 第 二 个 玩家 选择 . 那么 第 三 个 玩家 呢 ? 这 就 是 事情 变 得 棘手 的 地 方 . 如 果 第 二 个 
玩家 手中 每 种 花色 的 牌 各 有 一 张 , 那么 第 三 个 和 第 四 个 玩家 就 不 可 能 取 到 13 张 相 
同 花 色 的 牌 ; 但 是 , 如 果 第 二 个 玩家 只 取 到 了 2 种 花色 的 牌 (他 不 可 能 只 取 到 1 种 
花色 , 我 们 已 经 排除 了 这 种 可 能 性 ), 那么 危险 就 出 现 了 . 

天 啊 , 这 是 个 组 合 运算 的 路 梦 ! 我 们 要 分 情况 讨论 , 并 对 各 种 情况 进一步 细 分 . 
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是 哪 利 


作怪 有 这 么 多 人 讨厌 这 些 计数 问题 . 好 吧 . 我 们 看 看 下 列 情况 . 


情形 1: 第 二 个 玩家 手中 只 缺少 1 种 花色 的 牌 (如 果 缺 少 2 种 花色 , 那么 他 手 
中 的 牌 就 具有 同一 种 花色 , 但 这 种 情况 是 不 允许 发 生 的 ) 从 剩 下 的 3 种 花色 
中 挑 出 2 种 有 (3) 种 方法 . 这 样 就 给 出 了 26 张 牌 , 而 我 们 从 中 选 出 13 张 有 
(26) 种 选 法 ; 不 过 , 其 中 有 2 种 选 法 都 给 出 了 13 张 相 同 花 色 的 牌 , 这 很 不 妙 . 
因此 , 第 二 个 玩家 恰好 取 到 2 种 花色 的 牌 型 数 为 (3) ((29) 2)= 31 201 794. 
之 后 , 第 三 个 玩家 也 要 取 13 张 牌 , 但 他 可 能 拿 到 13 张 相 同 花 色 的 牌 . 幸运 
的 是 , 这 种 情况 只 有 一 种, 因为 前 两 个 玩家 已 经 取 到 了 3 种 花色 , 目前 只 科 
下 1 种 花色 还 没 被 选 过 . 因此 , 第 三 个 玩家 能 拿 到 的 有 效 牌 型 有 (29) -1 种， 
这 也 就 确定 了 第 四 个 玩家 能 拿 到 哪些 牌 . 综 上 所 述 , 这 种 情形 下 的 牌 局 数 为 


昌 (人 加 ?) (8 6 1 0 


情形 2: 如 果 第 二 个 玩家 没有 缺少 花色 呢 ? 为 了 保证 第 二 个 玩家 不 会 取 到 13 
张 相 同 花 色 的 牌 , 他 手中 的 牌 有 ( 吕 ) - 3 种 取 法 (这 就 是 减 去 3 的 原因 ). 第 
二 个 玩家 恰好 取 到 2 种 花色 的 牌 型 数 是 (3) ((1?3) 一 2) = 31 201 798. 于 是 ， 
对 第 二 个 玩家 来 说 , 剩 下 的 3 种 花色 中 每 种 花色 至 少 取 到 一 张 牌 的 牌 局 数 
为 (下 -3- (人 G)((25) 一 2)= 8 091 223 643， 此 时 , 第 三 个 和 第 四 个 玩家 都 
不 可 能 取 到 13 张 相同 花色 的 牌 , 因为 在 前 两 个 玩家 的 牌 中 , 每 种 花色 的 牌 
都 至 少 出 现 了 一 张 . 于 是 , 第 三 个 玩家 的 牌 有 (23) 种 取 法 , 而 第 四 个 玩家 有 
( 划 ) 种 取 法 . 综 上 所 述 , 这 种 情形 下 的 牌 局 数 为 


(人 (sj- 荔 Ga 人) 


= 84 153 580 662 988 200. 


现在 , 我 们 整理 并 找 出 答案 . 选 出 拿 到 13 张 同 花 色 牌 的 玩家 , 并 确定 他 拿 到 的 


花色 的 方法 一 共有 16 种 . 于 是 , 把 情形 1 和 情形 2 的 牌 局 数 分 别 乘 以 16， 


然后 再 


加 起 来 就 得 到 了 (激动 人 心 的 时 刻 到 了 ) 


1 351 649 568 167 404 896. 


见鬼 了 (你 可 以 使 用 更 狠毒 的 表达 ). 这 与 之 前 的 答案 1 351 649 568 417 019 320 


不 相等 . 尽管 相差 不 大 , 但 还 是 小 了 点 . 之 前 的 答案 比 现在 的 多 了 249 614 424. 哪 
个 答案 是 正确 的 ? 肯定 有 一 个 答案 是 对 的 吗 ? 在 考察 这 个 问题 的 过 程 中 , 我 们 得 到 


了 好 儿 个 不 同 的 数 ! 


我 不 打算 告诉 你 哪个 答案 是 正确 的 ,原因 有 如 下 几 个 . 首先 , 你 应 该 感受 一 下 
独立 完成 计算 的 乐趣 ! 其 次 , 更 重要 的 是 , 不 管 哪个 答案 是 正确 的 (如 果 有 一 个 正 


确 的 话 


), 你 都 应 该 清楚 这 两 种 方法 都 不 好 . 这 里 出 现 了 太 多 奇怪 的 加 减 运算 , 必须 


| 


大 大 
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牢记 要 仔细 计算 . 因为 没有 系统 的 计算 方法 , 所 以 我 们 很 有 可 能 在 某 些 时 刻 犯 些小 


潍 误 . 我 们 需要 一 种 更 好 的 方法 , 其 中 之 一 就 是 容 斥 方法 . 这 是 最 重要 的 计数 技巧 
之 一 , 整个 第 5 章 都 在 阐述 它 . 我 们 会 在 第 5 章 中 重新 讨论 这 个 问题 , 看 看 这 种 方 
法 是 如 何 轻松 解决 问题 的 . 简单 地 说 , 容 斥 方法 非常 清晰 地 冰 述 了 如 何 利 用 一 些 
本 事件 来 计算 复杂 事件 的 概率 . 让 我 们 把 这 最 后 几 页 看 作 学 习 高 等 理论 的 动力 ! 


也 | 


ee 


如 果 你 够 细心 的 话 , 可 能 会 奇怪 为 什么 我 没有 谈 到 编写 代码 以 及 对 概率 进行 数 
值 检验 . 好 的 , 这 里 就 有 一 些 代码 ! 有 趣 的 是 , 我 们 找到 了 一 种 干净 有 效 的 方法 来 


验证 是 否 至 少 有 一 个 玩家 拿 到 了 13 张 相同 花色 的 牌 。 下 面 我 们 一 个 不 错 的 方法 
并 在 习题 3.7.34 中 描述 一 种 更 好 的 思路 , 另 请 参阅 注 3.4.1. 
onesuit [numdo_] := Module[{}, 

count = 0; (* 成 功 次 数 的 计数 *) 

deck = {}; 


For[i = 1, i <= 4, i++, 


For[j = 1, j <= 13, j++, deck = AppendTo[deck, i]]]; 


For[n = 1, n <= numdo, n++, 


{ 


(* 这 个 成 功率 很 低 ， 所 以 每 完成 10% 的 进度 就 输出 一 次 *) 

(* 这 样 就 可 以 知道 我 们 已 经 完成 了 多 少 *) 

If [Mod[n, numdo/10] == 0, Print['"Have done ", 100.n/numdo, "%."]]; 

(* 随机 洗 牌 *) 

mix = RandomSample[deck] ; 

(* 把 这 副 牌 划分 成 四 手 且 每 手 有 13 张 牌 *) 

hands = Partition[mix, 13]; 

(* 把 onesuited 设置 为 0; 如 果 onesuited 始终 为 0， 那 么 没 人 拿 到 相同 
花色 的 牌 *) 

(* 如 果 onesuited 不 小 于 ， 那 么 至 少 一 个 人 拿 到 了 相同 花色 的 牌 *) 

onesuited = 0; 


(* 检验 每 个 人 拿 到 的 一 手 牌 是 否 为 相同 的 花色 *) 


(* 如 果 从 第 2 张 到 第 13 张 牌 的 花色 均 与 第 1 张 相同 ,那么 第 一 个 人 就 拿 到 了 一 手 


相同 花色 的 牌 ; 如 果 从 第 14 张 到 第 26 张 牌 的 花色 相同 ， 那 么 第 二 个 人 就 拿 
到 了 一 手相 同 花 色 的 牌 ; 依 此 类 推 *) 
For[i = 1, i <= 4，i++， 
(* 载 入 当前 要 考察 的 一 手 牌 *) 
possibleonesuited = 1; (* 初始 化 为 1 *) 
(+ 当 出 现 2 张 不 同 的 牌 时 ， 把 possibleonesuited 减 小 到 0 *) 


currenthand = hands[[i]]; 
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(* 检验 第 2 张 到 第 13 张 牌 是 否 均 与 第 1 张 牌 相同 *) 
(* 如 果 不 是 ， 那 么 把 possibleonesuited 减 小 到 0 *) 
(* 如 果 possibleonesuited 最 终 等 于 1， 那么 这 手 牌 一 定 是 相同 的 花色 *) 
For[j = 2, j <= 13, j++, 
If [currenthand[[j]] != currenthand[[1]],， 
possibleonesuited = 0] ; 
]; (* 结束 对 j 的 循环 *) 
If[possibleonesuited > 0, onesuited = onesuited+1] ; 
}]; (x 结束 对 i 的 循环 *) 
(+k 如 果 onesuited > 0， 那 么 至 少 有 一 个 人 拿 到 了 相同 花色 的 牌 ! *) 
(* 注意 ， 如 果 有 两 个 人 都 拿 到 了 相同 花色 的 牌 ， 那 么 只 计数 一 次 和) 
If[onesuited > 0, count = count + 1] ; 
站]; (* 结束 对 n 的 循环 *) 
Print ["0bserved probability is ", 100. count/numdo, "%."]; 
] 


通常 情况 下 , 我 会 给 出 理论 概率 (但 存在 一 些 争 议 ) 和 观测 概率 . 然而 遗憾 的 
是 , 在 1000 万 次 试验 中 , 没有 发 现 哪 个 玩家 拿 到 13 张 相同 花色 的 牌 ! 原因 在 于 这 
个 概率 实在 太 小 了 . 为 了 看 到 真实 的 概率 , 我 们 需要 用 更 好 的 方法 来 考察 大 量 牌 局 . 
当 把 代码 转移 到 比 Mathematica 更 快 的 环境 中 时 , 我 们 能 收获 巨大 的 成 效 , 但 这 仍 
需要 做 大 量 的 工作 . 我 们 把 这 个 问题 作为 练习 , 留 给 感 兴趣 的 读者 . 
注 3.4.1 最 后 , 有 必要 给 出 一 个 有 关 编 码 的 简短 注释 . 注意 , 我 们 通过 创建 
保存 变量 possibleonesuited 来 处 理 问 题 , 并 通过 12 次 比较 来 进一步 调整 . 也 可 
以 这 样 做 
If [Product [currenthand[[j]] ，{j ,1,13}] == currenthand[[1]]“13, 


onesuited = onesuited+1] ; 
这 是 一 种 不 错 的 、 简 洁 的 编码 方式 . 因为 413 等 于 67 108 864, 所 以 这 个 数 并 不 是 
太 大 . 也 就 是 说 , 我 们 把 寻找 最 高 效 、 内 存 密集 程度 最 低 的 方法 留 给 那些 对 编程 感 
兴趣 的 读者 . 一 种 可 能 的 情况 是 , 只 要 有 一 个 玩家 拿 到 了 2 种 花色 的 牌 , 某 些 计数 
循环 就 能 终止 . 
3.4.3 ”将 牌 的 分 配 

桥牌 (或 者 我 从 小 玩 的 一 种 比较 简单 的 变 体 游戏 一 一 惠 斯 特 牌 ) 最 大 的 问题 
之 一 是 , 试图 找 出 将 牌 所 有 可 能 的 分 配 情况 并 求 出 相应 概率 . 但 这 些 概率 常常 被 
算 错 . 接 下 来 , 我 们 要 对 问题 和 正确 答案 做 出 解释 , 并 检查 其 中 是 否 存 在 一 些 常见 
普 误 . 


桥牌 和 惠 斯 特 牌 的 玩法 是 这 样 的 : 如 果 你 叫 牌 叫 得 最 高 , 那么 你 搭档 的 牌 就 要 
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翻 过 来 , 让 所 有 人 看 到 . 


因此 , 你 知 


让 


道 


对 手 那 里 ; 但 是 , 你 不 清楚 每 一 个 对 手 有 多 少 张 将 牌 . 


a 


这 个 问题 和 


然 就 变 成 了 : 


对 于 13 张 将 牌 


有 尺 张 , 而 为 一 个 对 手 有 13 
有 牌 , 这 意味 着 有 5 张 将 牌 


在 对 手 那 里 ; 那么 对 


nN 


3 一 2 的 方式 进行 分 配 的 概率 分 别 是 多 少 ? 


先 来 考虑 50 的 分 配方 式 : 这 意味 着 有 
张 牌 均 选 自 非 将 牌 的 21 张 (这 两 个 对 手 共有 26 张 牌 , 其 
的 21 张 都 不 是 将 牌 ) 有 (2) 种 方法 来 
(5) 种 方法 , 然后 从 科 
法 , 这 样 他 就 拿 到 了 全 部 13 张 牌 


分 配给 该 玩家 共 


种 方法 . 注意 , 一 旦 指定 了 


两 个 对 手 


来 说 , 从 他 们 共有 的 26 张 牌 9 


到 底 有 多 少 张 将 牌 在 你 们 队 手 中 , 有 多 少 张 在 


因此 , 实现 这 种 分 配方 式 有 (3) () 
个 对 手 的 牌 , 那么 另 一 个 对 手 的 牌 也 就 


定 一 个 对 手 的 所 有 
5 一 0 分 配方 式 的 概率 为 406 
那么 4 一 1 分 本 


了 4 张 将 牌 , 为 这 个 玩家 分 配 4 张 将 牌 有 ( 
同样 地 , 此 时 另 一 个 对 手 的 牌 
下 的 牌 . 于 是 , 实现 这 种 分 配方 式 有 (1) (5) (5) = 2 939 300 种 方法 ， 


另外 9 张 牌 . 


站 也 就 完全 看 


方式 的 情况 如 何 ? 我 人 


定 了 男 一 个 对 手 能 拿 到 的 牌 
980/10 400 600 = 9/230, 或 约 为 3.91%. 


站 仍 有 (2?) 种 方法 来 0 


就 被 完全 确定 了 ， 


有 有 


, 如果 你 们 队 有 mn 张 , 那么 一 个 对 手 
有 张 的 概率 是 多 少 ? 例如 , 假设 你 们 队 有 8 张 将 
手 的 5 张 将 牌 是 按照 5 一 0,4 一 1 或 


个 对 手 恰 有 5 张 将 牌 , 而 他 剩 下 的 8 

中 有 5 张 是 将 牌 , 所 以 剩 下 

定 是 哪个 对 手 拿 到 了 5 张 将 牌 , 把 5 张 将 牌 
下 的 21 张 牌 中 为 他 选 出 8 张 ,有 (办 ) 种 方 


(%) = 406 980 
定 了 . 对 这 
Ph 选 出 13 张 有 (39) = 10 400 600 种 方法 ( 选 
), 于 是 我 们 得 到 出 现 
上 定 哪个 对 手 拿 到 
1) 种 方法 , 然后 有 ( 久 ) 种 方法 为 他 选 出 
因为 他 拿 到 的 就 是 剩 


1 


其 概率 就 等 


2 939 300/10 400 600 = 13/46, 或 约 为 28.26%. 


最 后 考察 3 一 2 的 分 配方 式 . 
5 张 将 牌 中 选 出 3 张 分 配给 这 个 玩家 , 有 (3) 种 方法 ; 然后 
一 共有 G0?) G3) (70)= 7 054 320 种 可 能 的 分 配方 法 . 那 
出 现 这 种 分 配方 式 的 概率 为 7 054 320/10 400 600 = 78/115, 或 约 为 67.83%. 


牌 , 这 有 (2) 种 分 法 . 于是， 
么 ， 


二 | 


首先 , 选 出 拿 至 


| 3 张 将 牌 


Ni 


然 , 我 们 现在 可 以 进行 一 致 


价 的 
(29)= 10 400 600. 我 们 看 至 


改 法 是 ， 把 实现 这 三 种 分 本 


并 不 能 证 明 我 们 没有 


我 们 考虑 解决 这 个 问题 的 另 一 和 


方式 的 所 有 


且 . 不 和 全 


征 口 村 jj 


的 对 手 有 (?) 种 方法 . 从 
再 分 配给 他 10 张 非 将 


FE 检验 : 把 这 三 个 概率 相 加 , 看 和 是 否 为 1 等 
可 能 性 的 个 数 加 起 来 , 看 和 
| 406 980 十 2 939 300 十 7 054 320 = 10 400 600. 虽然 这 
犯错 , 但 它 很 好 地 表明 了 结果 都 很 合理 ! 
方法 . 虽然 这 种 方法 看 起 来 应 该 是 合理 的 , 但 


它 有 一 个 非常 微妙 的 错误 . 为 了 把 握 这 一 根本 问题 , 我 们 有 必要 仔细 地 慢 慢 阅读 . 


我 们 要 把 26 张 牌 (5 张 将 牌 和 21 张 非 将 牌 ) 分 本 
对 于 每 一 张 将 牌 , 为 什么 不 看 看 它 属 于 第 一 个 人 还 


目 . 多 


征 邢 


二 个 人 了 呢 ? 很 


| 


给 两 个 人 , 且 每 人 拿 到 13 张 牌 . 


明显 , 每 一 下 


KK 


将 牌 都 等 可 能 地 分 配给 两 人 中 的 任何 一 人 ， 因 此 , 每 张 牌 都 有 50% 的 概率 分 给 第 


一 个 人 , 也 有 50% 的 概率 分 给 第 


宇 个 人 . 


个 ) 


沿 着 这 


思路 进行 论证 , 所 有 将 牌 都 在 第 一 个 人 手中 的 概率 是 1/32. 同样 地 ， 
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所 有 将 牌 都 在 第 二 个 人 手 
率 是 2/32 或 约 为 6.25%. 这 和 我 们 之 前 求 


率 是 9/230, 约 为 3.91%. 


接 下 来 , 我 们 考虑 4 一 1 这 种 分 本 
人 . 从 5 张 将 牌 中 选 出 第 一 个 人 的 4 张 共 有 ( 
第 一 个 人 手中 的 概率 均 为 50%. 剩 下 的 那 张 将 牌 有 50% 的 概率 落 到 第 二 个 人 手 里 . 
办 此, 第 一 个 人 恰好 拿 到 4 张 将 幅 
由 于 第 一 个 人 和 第 二 个 人 都 有 


FP 的 概率 也 是 1/32. 于 是 , 实现 5 一 0 这 种 分 配方 式 的 概 
的 结果 有 很 大 不 同 : 第 一 次 求 出 的 概 


/2)41/2= 5/32, 或 约 为 15.625%. 
,为 了 求 出 4 一 1 分 配方 式 的 概 


泉 中 选 出 4 张 分 给 第 一 个 
) 种 选 法 , 并 且 每 张 被 选中 的 牌 落 到 


率 , 我 们 必须 把 上 述 结 果 翻 倍 . 因此 , 实现 4 一 1 分 配方 式 的 概率 为 10/32, 或 约 为 


31.25%. 这 接近 于 我 们 之 前 算出 的 28.26%, 但 更 大 一 些 . 


最 后 , 3 一 2 的 分 配方 式 5 
张 将 牌 , 那么 这 种 情况 发 生 的 概率 就 是 (假设 同 
5/16, 约 等 于 31.25%. 把 这 个 结果 而 


以 按照 类 似 方 法 进行 处 到 


.如 果 第 一 个 玩家 拿 到 了 3 
时 分 配 5 张 将 牌 )(3)(1/2)3(172)2 一 


张 将 牌 ). 这 个 值 接近 但 不 等 于 67.8 
我 们 显然 犯 了 个 错误 , 但 
小 例子 来 找 出 一 些 基 本 线索 , 然后 
偏好 , 将 其 称 为 简单 示例 法 . 5 


会 看 到 第 二 种 方法 (采用 貌似 可 信 


到 了 62.5%( 因 为 每 个 玩家 都 可 能 拿 到 3 


晶 到 这 样 的 情况 时 , 最 好 先 通 过 一 个 
再 回 过 头 来 考察 最 初 的 问题 . 考虑 到 我 对 命名 的 
后 继续 上 面 的 讨论 . 我 们 将 
的 50% 论证 ) 出 错 的 原因 . 


假设 有 4 张 牌 , 其 中 2 张 将 牌 和 2 张 非 将 牌 . 我 们 想 把 这 4 张 牌 分 给 两 个 玩 


家 Alice 和 Bob. 于 是 , 每 个 玩家 会 拿 到 2 张 牌 , 并 


有 多 少 种 分 法 呢 ? 共有 (分 (人 ] = 6 种 (Alice 会 拿 到 (4 


所 有 分 法 都 是 等 可 能 出 现 的 . 
) 种 可 能 的 牌 型 , 而 Bob 的 牌 


也 将 随 之 确定 ). 把 所 有 将 牌 都 分 给 一 个 玩家 的 分 法 有 多 少 种 ? 只 有 两 种 : 要 么 都 


分 给 了 Alice, 要 么 都 分 给 了 Bob. 


33%. 
现在 , 我 们 用 第 二 利 


论证 方法 重 


比 , 实现 2 一 0 分 配方 式 的 概率 为 2/6, 或 约 为 


新 叙述 一 所 . 先 看 看 第 一 张 将 牌 ; 由 于 第 一 张 


将 牌 被 等 可 能 地 分 配给 两 个 玩家 , 所 以 它 有 50% 的 概率 分 给 Alice, 50% 的 概率 分 
给 Bop. 第 二 张 将 牌 也 是 如 此 . 按照 之 前 的 说 法 , 所 有 将 牌 都 分 给 Alice 的 概率 是 


1/2 . 1/2( 因 为 每 张 牌 都 有 50% 的 概率 分 给 第 一 个 玩家 ), 它们 都 分 给 Bob 的 概率 


同样 为 1/2 . 1/2. 把 上 述 概率 相 加 就 得 到 了 1/2 或 50%, 它 大 于 1/3 或 33%. 我 们 


哪里 出 错 了 ? 


我 们 把 事件 错误 地 混淆 在 了 一 起 . 没 错 , 每 张 牌 都 等 可 能 地 分 给 两 个 玩家 , 这 
一 点 没 问题 . 出 错 的 地 方 是 : 当 把 第 一 张 将 牌 分 给 了 Alice 之 后 , 第 二 张 将 牌 也 分 给 
Alice 的 概率 仍 是 1/2. 换 句 话说 , 如 果 Alice 已 经 拿 到 了 一 张 将 牌 , 那么 她 拿 到 第 二 


张 将 牌 的 概率 就 会 变 小 ! (关于 这 个 现象 的 另 一 个 例子 , 请 


问题 . ) 


参阅 5.1.1 节 中 的 ABBA 
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有 许多 好 方法 都 能 阐述 这 个 问题 . 第 一 张 将 牌 一 定 会 分 给 某 
它 分 给 了 Alice. 记 住 , 我 们 只 关心 将 牌 的 分 配方 式 是 不 是 2 一 0 


玩家 拿 到 了 这 2 张 将 牌 . 


个 玩家 , 不 妨 假设 


因此 , Alice 拿 到 了 第 一 张 将 牌 . 


于 Alice 需要 2 张 牌 ， 


, 并 不 在 乎 是 哪个 


所 以 她 还 要 再 挑选 1 张 , 而 现在 共 剩 下 了 3 张 牌 . 此 时 , 3 张 牌 中 的 每 张 都 会 等 可 


能 地 分 给 Alice. 


因此 , Alice 得 到 第 二 张 将 牌 的 概率 不 是 1/2, 而 
下 面 给 出 看 待 这 个 问题 的 男 一 种 方法 . 第 一 张 将 牌 分 给 了 Al 


是 1/3. 


ice, 现在 还 剩 下 3 


张 牌 . Alice 还 需要 1 张 牌 , 而 Bob 还 需要 2 张 . 因此 , 对 剩 下 的 每 一 张 牌 来 说 , 它 
被 分 给 Bob 的 概率 是 被 分 给 Alice 的 两 倍 . 换 句 话说 , 剩 下 的 3 个 空位 会 等 可 能 地 
放 入 这 3 张 牌 . 因此 , 对 第 二 张 将 牌 来 说 , 分 给 Bob 的 概率 是 2/3, 但 分 给 Alice 的 


概率 是 1/3. 


是 的 , 每 张 牌 都 有 50% 的 概率 被 分 配给 他 
分 配 的 前 提 下 才能 成 并 . 看 看 下 十 


E 何 一 个 玩家 , 但 这 要 在 所 有 牌 都 尚未 
打 这 种 情况 : 虽然 每 张 牌 都 有 50% 的 概率 被 分 配 


给 两 个 玩家 中 的 任何 一 个 , 但 在 Alice 拿 到 2 张 牌 之 后 , 她 就 没有 机 会 拿 到 剩 下 的 
牌 了 . 所 以 我 们 不 能 直接 把 概率 相 乘 . 


把 过 程 写 出 来 或 许 更 有 助 于 我 们 理解 . 不 妨 设 黑 桃 是 将 牌 ， 
1 和 、2 和 、39 和 49( 为 了 
牌 的 花色 相同 ). 表 3-1 展示 


并 把 这 4 张 牌 设 为 


使 例子 尽 可 能 简单 直观 , 我 故意 让 数字 弟 
把 牌 平均 分 成 两 份 的 所 有 分 法 . 我 


增 , 并 让 另外 2 引 
门 始终 把 黑 桃 放 在 


2 


ml 


红 桃 前 面 , 并 把 较 小 的 数 放 在 较 大 的 数 之 前 . 这 样 做 的 原因 是 , {1@,2@} 也 可 以 写 


成 {2@,1@}, 这 两 种 写法 都 正确 , 它们 代表 了 同一 种 牌 型 . 总之， 


一 共有 6 种 可 能 


的 结果 . 
表 3-1 把 4 张 牌 平均 分 配给 两 个 玩家 的 6 种 方法 
分 法 1 分 法 2 分 法 3 分 法 4 分 法 5 分 法 6 
玩家 1 {1 的 , 2 的} {1@, 30} {1@, 40} {2®@, 30} {2 全 ,4S} {3S9,4S1} 
玩家 2 {3S9,4S9} {2 介 ,49 {2®@, 30} {1@, 40} {1®@,30} {1 后, 2 的} 
花 几 分 钟 时 间 来 仔细 看 看 这 个 表格 . 我 们 发 现 , 第 一 个 玩家 拿 到 1@ 的 分 法 共 


有 3 种 (分 法 1、2 和 3), 他 拿 到 2@ 的 分 法 也 有 3 种 (分 法 1、4 和 5). 因此 每 一 
种 情况 出 现 的 概率 都 是 50%. 那么 1@ 和 2@ 被 分 给 同一 个 玩家 的 概率 有 
6 种 分 法 中 , 出 现 这 利 


配方 式 的 概率 是 2/6 或 1/3, 而 不 是 1/2. 


当 你 遇 到 不 确定 的 情形 时 , 画 


多 大 ?在 


情况 的 分 法 只 有 2 种 (分 法 1 和 6). 这 意味 着 出 现 2 一 0 分 


张 示 意图 , 考察 一 个 特例 , 并 试 着 从 中 找 出 线 


索 . 这 样 就 能 看 到 发 生 了 什么 . 示意 图 比 文字 更 直观 . 但 是 , 对 于 很 多 问题 (比如 ， 


试 着 求 出 恰 有 


个 人 拿 到 13 张 同 花 色 牌 的 概率 ), 把 所 有 的 东西 


都 写 出 来 是 不 现实 


的 . 不 过 , 这 并 不 意味 着 我 们 应 该 放弃 示意 图 . 我 们 要 专注 于 一 个 较 简 单 的 情形 , 并 


试 着 找 出 关键 特性 . 


3.5 附录 : 计算 概率 的 代码 125 
乘法 法 则 失效 了 ! 出 了 什么 问题 ? 为 什么 会 失效 ? 问题 出 现在 , 关于 某 个 事件 
的 信息 还 涉及 了 另 一 个 事件 . 这 就 引出 了 独立 性 和 依赖 性 的 概念 . 我 们 将 在 第 4 章 


中 详细 


讨论 这 些 内 容 , 而 现 帮 


3.5 


3.5.1 ”将 牌 的 分 配 和 代码 


E 只 是 希望 能 激发 你 深入 研究 到 


E 论 的 兴趣 . 
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在 3.4.3 节 中 , 我 们 采用 了 几 种 不 同 的 方法 来 计算 将 牌 按照 5 一 0 的 方式 进行 


分 配 的 概率 (这 意味 着 你 和 队友 共有 8 张 将 牌 , 而 P 


两 个 对 手 共有 5 张 将 牌 ), 并 得 到 


下 


了 不 同 的 结果 . 当 你 使 
检验 是 个 不 错 的 主意 . 下 面 


是 


牌 分 配给 两 个 玩家 的 大 量 分 法 , 其 中 有 5 张 将 牌 . 
在 给 出 代码 之 前 (有 详细 
路 . 这 不 是 最 糟 的 方法 , 但 也 不 是 最 好 的 , 之 后 将 给 出 另 一 


EE 


用 多 种 方法 得 到 了 不 同 的 答案 时 , 编 
个 简单 的 Mathematica 程序 , 它 可 以 模拟 把 26 张 


表示 这 些 牌 . 记 住 , 我 们 


些 代 码 来 进行 数值 


I 


的 注解 ), 我 们 先 描述 解决 这 个 问题 的 一 些 选择 和 思 


种 方法 . 
的 目标 是 计算 给 定 的 概 


我 们 要 做 的 第 一 个 选择 是 怎 村 
率 , 那些 无 关 信息 可 以 丢掉 . 最 终 , 我 们 只 关心 5 张 将 牌 是 


否 分 给 了 同一 个 玩家 . 


因 


此 , 不 妨 把 这 26 张 尚未 分 配 的 牌 记 作 1,2,… ,26, 并 把 1、 


2、3、4 和 5 这 5 张 牌 看 


作 将 牌 . 把 牌 表示 成 数 之 后 , 就 可 以 使 用 简单 的 函数 来 验 说 


F 它 们 是 否 被 分 给 了 同一 


三 口 


个 玩家 . 例如 , 不 需要 检查 1、2、3、4 和 5 是 否 分 
次 ), 我 们 只 需 整 理 每 个 玩家 手中 的 牌 , 并 对 最 小 上 
且 仅 当 该 玩家 拿 到 了 5 张 将 牌 ! 
fiveohsplit [num_] := Module[{}, 
(* 计算 将 牌 按照 5-0 的 方式 进行 分 配 的 概率 *) 
(* 假设 第 1 组 两 个 人 共有 8 张 将 牌 ， 另 一 组 有 5 张 牌 *) 
(* 因此 只 需 考 虑 26 张 牌 *) 
(* 用 1~ 26 来 标记 这 26 张 牌 ， 其 中 1~ 5 是 将 牌 *) 
deck = {}; 
For[i 1, i <= 26, i++, deck = AppendTo[deck, i]]; 
count = 0; (* 记录 得 到 5-0 的 次 数 *) 
For[n = 1, n <= num, n++，(* 对 n 循环 num 次 *) 


创建 两 手 牌 . 从 26 张 牌 中 随机 选 出 13 张 *) 
对 13 张 牌 进行 排序 *) 


WY I 


handone = Sort[RandomSample[deck, 13]]; 


给 了 同一 个 玩家 (这 需要 验证 5 
的 5 个 数 求 和 . 这 个 和 等 于 15, 当 


如 果 前 5 张 牌 是 1 ~5， 那 么 第 一 个 玩家 就 得 到 了 其 余 5 张 将 牌 *) 
通过 判断 前 5 个 数 之 和 是 否 为 15， 可 以 轻松 地 验证 这 一 ， 


点 #) 
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(* 现在 给 出 第 二 手 牌 *) 
(* 一 共有 26 张 牌 ， 
把 不 属于 第 一 个 玩家 的 牌 全 都 发 给 第 二 个 玩家 *) 
(* 为 此 ， 使 用 MemberQ 命令 *) 
handtwo = {}; 
For[i = 1, i <= 26, i++, If[MemberQ[handone, i] == False, 
handtwo = AppendTo[handtwo, i]]]; 
handtwo = Sort [hanqtwo] ; 
(* 使 用 or 语句 是 为 了 确定 : 两 个 玩家 中 是 否 有 一 个 拿 到 了 其 余 所 有 将 牌 *) 
(* 很 好 ， 这 一 点 也 可 以 用 求 和 来 检测 ! *) 
If [Sum[handone[[i]], {i, 1, 5}] == 15 
|| Sum[handtwo[[i]], {i, 1, 5}] == 15, count = count + 1]; 
外 ; (* 结束 对 n 的 循环 *) 
(* 输出 观察 到 的 百分比 和 不 同 理论 的 结果 *) 


Print["Observed percentage 5-0 is ", 100. count/num, "%."]; 


Print["Theory from Binomials: ", 100.0 2 Binomial[5, 5] 


Binomial[26 - 5, 13 - 5]/Binomial[26, 13], "%."]; 


Print["Theory from Cond Prob Prod: "， 


100.0 2 (13/26) (12/25) (11/24) (10/23) (9/22), "%."]; 


Print["Theory from each card 1/2 chance: ", 100.0 2 (1/2)*5, "%."]; 
ls 


考察 100 万 种 牌 型 后 , 我 们 发 现 : 


Observed percentage 5-0 is 3.91590%. 


Theory from Binomials: 3.91304%. 
Theory from Cond Prob Prod: 3.91304%. 
Theory from 2 * (1/2)°5: 6.25000%. 


我 们 为 一 个 玩家 随机 分 配 13 张 牌 . 如 果 他 拿 到 的 所 有 有 牌 之 和 是 0 或 5, 那么 分 配 


现在 给 出 另 一 种 方法 . 因为 我 们 只 在 乎 一 张 牌 是 不 是 将 牌 , 所 以 不 妨 把 5 张 将 
牌 都 记 作 1, 并 把 其 余 21 张 非 将 牌 都 记 作 0, 这 样 就 有 了 一 副 更 简单 的 牌 . 接 下 来 ， 


方式 就 是 5 一 0, 否则 就 不 是 . 注意 , 这 种 方法 要 容易 得 多 . 我 们 既 不 需要 查看 为 一 
个 玩家 手中 的 牌 , 也 不 用 验证 每 一 张 牌 是 不 是 将 牌 . 在 去 掉 不 必要 的 内 容 之 后 , 编 


写 代码 通常 就 会 容易 很 多 . 因此 : 多 花 些 时 间 去 思考 你 的 代码 . 当 要 求 效率 时 


,这 


一 点 变 得 非常 重要 (例如 , 计算 有 一 个 玩家 拿 到 同 花 色 牌 的 概率 ); 不 过 , 现在 它 并 
不 是 那么 重要 , 但 养 成 良好 的 习惯 也 是 不 错 的 . 


trumpsplit [numdo_] := Module[{}, 


count = 0; 


deck = 人 ; (* 把 一 副 牌 (deck) 初 始 化 为 空 集 *) 
For[n = 1, n <= 5, n++, deck = AppendTo[deck, 1]]; 
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For[n = 6, n <= 26, n++, deck = AppendTo[deck, 0]]; 


For[n = 1, n <= numdo，n++， (* 代码 的 主 循环 *) 
{ 


hand = RandomSample[deck, 13]; (* 随机 选取 13 张 牌 *) 


numtrump = Sum[hand[[k]], {k, 1, 13}]; 
(* 注意 ， 当 得 到 5-0 分 配 时 numtrump 为 0 或 5 *) 


If [numtrump == 0 || numtrump == 5, count = count + 1]; 


(* count 是 计数 器 ， 用 来 计算 5-0 出 现 的 频率 *) 
(* 我 们 用 11 表示 “或 ”， 用 && 表示 “并 ”， 
用 两 个 等 号 来 表示 比较 *) 
]]; (* 结束 对 n 的 循环 *) 
Print["Two theories: binomial gave "，6.25， 
"%，cond prob gave 3.913%."]; 
Print ["We observe ", 100. count/numdo, "%."]; 


]; 


3.5.2 ”扑克 牌 型 的 代码 


现在 , 我 们 来 探讨 如 何 模 拟 一 些 扑克 有 牌 型 的 概率 . 我 们 的 第 一 个 任务 是 计算 恰 
有 2 张 KK 的 概率 (如 果 想 求 至 少 有 2 张 K 的 概率 , 只 需要 把 下 面 的 numkings==2 
蔡 换 成 numkings>=2 就 行 了 ). 这 一 次 , 一 副 牌 中 的 4 个 K 都 用 1 来 表示 , 剩 下 的 
48 张 牌 都 用 0 来 表示 . 然后 , 我 们 随机 选 出 5 张 牌 , 并 计算 它们 的 和 . 如 果 和 为 2， 
那么 我 们 就 恰好 取 到 了 2 张 K! 这 体现 出 了 该 方法 的 威力 一 一 不 用 检查 是 否 取 到 


了 某 些 特定 牌 , 用 恰当 的 数 来 表示 一 副 牌 就 能 容易 地 判断 出 我 们 是 否 拿 到 了 满足 特 


定 条 件 的 牌 . 
twokings [numdo_] := Module[{}, 
deck = 人 {}; (* 把 一 副 牌 (deck) 初 始 化 为 空 集 *) 
(* k 是 1， 非 k 是 0 *) 


For[n = 1, n <= 4, n++, deck = AppendTo[deck, 1]]; 
For[n = 5, n <= 52, n++, deck = AppendTo[deck, 0]]; 


count = 0; (* 将 成 功 的 次 数 初始 化 为 0 *) 

For[ln = 1, n <= numdo, n++, 

{ 
hand = RandomSample[deck, 5]; (* 一 手 5 张 牌 *) 
numkings = Sum[hand[[k]], {k, 1, 5}]; 
If [numkings == 2, count = count + 1]; 


}]; (* 结束 对 n 的 循环 *) 


Print["Theory predicts prob exactly two kings is "， 
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100.0 Binomial[4，2] Binomial[48, 3]/ Binomial[52, 5], "%."]; 
Print["Observed probability is ", 100.0 count/numdo, "%."]; 
]; 
考察 100 万 种 牌 型 后 , 我 们 看 到 : 
Theory predicts prob exactly two kings is 3.99298%. 
Dbserved probability is 3.9965%. 
把 问题 变 得 更 难 一 点 , 我 们 现在 要 问 的 是 : 计算 取 到 一 个 萌 芦 的 概率 , 并 且 这 
个 戎 芦 是 由 和 Q 组 成 的 . 所 以 , 我 们 可 能 拿 到 2 张 K 和 3 张 Q, 也 可 能 拿 到 3 
张 K 和 2 张 Q. 我 们 把 KK 表示 成 1, 把 Q 表示 成 10, 把 其 他 所 有 牌 都 表示 成 0. 如 
果 我 们 取 到 了 葫芦 , 那么 所 有 有 牌 之 和 一 定 是 32 或 23; 于 是 , 我 们 需要 的 就 是 简单 
的 0R 比较 (Mathematica 中 的 代码 是 |1). 有 关 这 个 方法 的 更 多 内 容 , 请 参阅 习题 
5.1.1. 
fullkingqueens [numdo_] := Module[{}, 
deck = 人 {; (+ 把 一 副 牌 (deck) 初 始 化 为 空 集 *) 
(* Q 是 10，K 是 1， 其 他 牌 是 0 *) 
For[n = 1, n <= 4, n++, deck = AppendTo[deck, 1]]; 
For[n = 5, n <= 8, n++, deck = AppendTo[deck, 10]]; 
For[n = 9, n <= 52, n++, deck = AppendTo[deck, 0]]; 
count = 0; (* 将 成 功 的 次 数 初始 化 为 0 *) 
For[ln = 1, n <= numdo, n++, 
{ 
hand = RandomSample[deck, 5]; (* 一 手 5 张 牌 *) 
numkings = Sum[hand[[k]], {k, 1, 5}]; 
(* 想得到 由 Q 和 K 组 成 的 戎 芦 *) 
(* 这 手 牌 的 和 应 该 是 23 或 32! *) 
If [numkings == 32 || numkings == 23, count = count + 1]; 
]]; (* 结束 对 n 的 循环 *) 
Print["Theory predicts prob full house (Qs and Ks) is "， 
100.0 Binomial[2, 1] Binomial[4, 3] Binomial[4, 2]/ 
Binomial[52, 5] , "%."]; 
Print["Observed probability is ", 100.0 count/numdo, "%."]; 
js 
考察 1000 万 种 牌 型 后 (这 次 考察 的 牌 型 数 是 之 前 的 10 倍 ; 这 样 做 是 因为 这 个 
概率 太 小 了 , 我 们 需要 更 多 的 数据 来 确保 值 的 真实 性 ), 我 们 看 到 : 
Theory predicts prob full house (Qs and Ks) is 0.00184689%. 
Observed probability is 0.00168%. 


最 后 , 我 们 从 更 一 般 的 角度 来 考察 葫芦 的 问题 , 此 时 不 考虑 萌 芒 是 由 什么 构成 
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的 . 


如 果 我 们 要 选 的 是 两 种 花色 , 那么 情况 就 容易 多 了 .幸运 的 是 , 我 们 可 以 调整 


日 


我 人 


F 面 的 想法 . 我 们 要 做 的 是 把 13 个 点 数 依次 表示 为 1, 10, 100,… , 10322, 并 让 每 个 
重复 出 现 4 次 , 这 样 就 能 构成 一 整 副 牌 . 然后 再 从 中 取出 5 汪 并 求 出 它们 的 和 . 


] 能 取 到 一 个 戎 芦 , 当 且 仅 当 这 个 和 的 所 有 数位 上 的 数字 都 是 0、2 和 3( 并 且 2 
和 3 一 定 会 出 现 ). 利用 IntegerDigits 命令 , 我 们 可 以 很 容易 地 查看 2 和 3 是 否 


出 现 , 该 命令 可 以 列 出 这 个 和 的 所 有 十 进 制 位 上 的 数字 . 接 下 来 两 次 使 


函数 (使 用 了 一 个 or 语句 ) 来 确保 2 和 3 的 确 会 出 现 . 


fullhouse[numdo_] := Module[{}, 


count = 0; (* 这 是 一 个 计数 变量 ， 用 来 计算 成 功 的 次 数 *) 
deck = {; (* 初始 化 一 副 人 所 有 上 牌 依次 记 作 1,10,100,1000,... 


For[n = 1, n <= 13, n++, 


For[j = 1, j <= 4, j++, 
deck = AppendTo[deck, 10°(n - 1)] 
]] ; (* for 循 环 结 束 ，deck 被 创建 *) 


For[n = 1, n <= numdo, n++, 


{ 
hand = RandomSample[deck, 5]; (* 随机 选取 5 张 牌 *) 
value = Sum[hand[[k]]，{k，1，5}]; (* 把 这 5 张 牌 对 应 的 数 相 加 *) 
(* 接 下 来 的 几 行 很 巧妙 .如 果 这 手 牌 的 和 是 10 002 011，*) 
(* 就 意味 着 1000 出 现 了 2 次 ，1、10 和 10 000 000 分 别 出 现 1 次 ，*) 
(* 这 是 为 了 进行 检验 ! *) 
(* 要 想得到 一 个 戎 芦 ， 唯 一 的 办 法 是 数位 上 出 现 一 个 2 和 一 个 3， 
或 者 数位 上 非 堆 数字 之 积 为 6. 然而 ， 利 用 MemberQ 对 2、3 进 行 检查 
会 更 容易 ; 我 们 会 展示 两 种 方法 *) 
valuelist = IntegerDigits[value] ; 
If [MemberQ[valuelist，2] == True && 


MemberQ [valuelist，3] == True, count = count + 1]; 
(* 下 面 展 示 如 何 利 用 数字 之 积 来 验证 *) 


trimlist = {}; 

For[j = 1, j <= Length[valuelist], j++, 

If[valuelist[[j]] > 1, trimlist = AppendTo[trimlist, 
valuelist[[j]]] 

dy 

If[Product[trimlist[[j]],{j,1i,Length[trimlist]}] \[Equal] 6, 


count = count+1]; 


1 MemberQ 


*) 
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]]; (* 结束 对 n 箱 环 *) 
Print["Prob of a full house: "， 

100.0 Binomial[13，2] Binomial[2, 1] Binomial[4， 
3] Binomial[4, 2] / Binomial[52, 5], "%."]; 
Print["Observed prob: ", 100.0 count/numdo, "%."]; 
]; 
考察 200 万 种 牌 型 后 , 我 们 发 现 : 
Prob of a full house: 0.144058%. 

Observed prob: 0.14615%. 


3.6 总 结 


虽然 我 们 已 经 讨论 了 三 种 最 重要 的 纸牌 游戏 (以 及 广 受 欢迎 的 井 字 游戏 ), 但 是 


只 触及 了 几 个 大 问题 的 表面 . 也 就 是 说 , 尽管 你 掌握 了 处 到 
这 些 方法 用 起 来 并 不 总 是 那么 容易 和 整洁 .我们 看 到 可 能 


这 些 问 题 的 好 方法 , 但 


情况 的 数量 会 快速 地 增 


长 . 对 于 简单 的 问题 , 我 们 也 会 一 直 担 心 有 重 复 计数 和 遗 


山菜 种 可 能 性 的 问题 . 如 


果 能 时 刻 保 持 警 惕 并 做 出 恰当 的 删 减 , 是 可 以 解决 这 些 问题 的 , 但 这 种 用 蛮 力 的 方 


法 并 不 太 好 . 我 们 需要 更 好 的 解 题 方法 
我 最 喜欢 的 歌 


巴 


一 是 肯 尼 ”罗杰斯 的 《 赌 徒 》( 尤 其 是 布 偶 版 ), 其 中 两 句 
是 :“ 每 个 赌 徒 都 知道 , 生存 的 秘密 就 是 , 知道 要 扔 掉 什 么 , 知道 要 保留 什么 .” 在 概 


率 论 中 , 这 是 一 个 极 好 的 建议 ! 你 要 学 会 如 何 计数 . 在 前 面 的 讨论 中 , 我 们 不 断 地 


抛弃 一 些 东 西 , 并 添加 一 些 内 容 . 这 样 做 虽然 有 用 , 但 会 搞 得 一 团 糟 . 在 第 4 章 中 ， 


我 们 将 学 习 如 何 顺 利 地 完成 这 些 计算 . 


3.7 习 题 


习题 3.7.1 ”许多 函数 和 序列 都 是 用 递 推 法 来 定义 的 . 在 斐 波 那 契 


义 为 前 两 项 之 和 , 前 两 项 通常 是 0 和 1 或 者 1 和 2( 根 据 问题 的 不 同 , 每 种 定义 都 有 其 优 


数列 {FF} 中 , 后 续 项 被 定 


点 和 缺点 ). 写 出 斐 波 屠 契 数列 的 递 推 公式 , 并 逢 
V2 < Ph, <2". 


A 


该 公式 证 明 : 对 于 任意 的 nz 6, 均 有 


习题 3.7.2 ”抛掷 一 枚 均匀 的 硬币 60 次 , 计算 恰好 撕 出 10 次 正面 的 概率 . 


习题 3.7.3 。 从 一 副 洗 好 的 牌 中 抽取 两 张 , 问 这 两 张 牌 之 和 等 于 21 
Q 和 K 的 值 都 是 10, A 牌 的 值 是 11. 


的 概率 是 多 少 ? 假 设 10、J、 


习题 3.7.4 ”假设 一 副 牌 中 共有 40 张 牌 (一 副 标 准 牌 有 52 张 , 把 点 数 为 7、8 和 9 的 牌 从 一 


习题 3.7.5 ”在 不 考虑 次 序 的 前 提 下 , 把 6 个 人 分 成 每 3 人 一 组 , 有 多 少 种 方法 ? 
习题 3.7.6 ”在 不 考虑 次 序 的 前 提 下 , 把 6 个 人 分 成 每 2 人 一 组 , 有 多 少 种 方法 ? 


习题 3.7.7 nn 的 双 阶 乘 记 作 nll, 指 的 是 : 从 n 到 2( 如 果 n 是 


副 
到 


标准 牌 中 去 掉 ). 从 中 任 取 5 张 牌 , 问 取 到 顺 子 的 概率 是 多 少 ? 取 到 同 花 的 概率 呢 ? 取 


皇家 同花顺 ( 即 从 10 开始 的 顺 子 , 并 且 所 有 牌 具有 相同 的 花色 ) 的 概率 是 多 少 ? 如 果 


从 52 张 牌 中 抽取 , 那么 这 些 概 率 会 有 不 同 吗 ? 


果 
(7 


频率 远 高 于 阶乘 的 阶乘 . 证 


n 是 个 奇数 ) 的 所 有 奇偶 性 相同 的 数 的 乘积 : 因此 71! 
!)! = 5040!( 注 意 5040! 约 为 1016 43)， 如 此 定义 双 阶 乘 的 原因 是 , 这 个 表达 式 出 现 的 


每 一 对 都 是 无 序 且 无 标记 上 


一 样 的 . 


习题 3.7.8 ”更 一 般 地 , 当 不 考 
习题 3.7.9 “对 于 任意 的 m e {100,1000,10000}, 计算 ml! 的 末端 有 多 少 个 0 能 否 找 到 一 
个 公式 , 能 够 用 来 计算 10*! 
习题 3.7.10 ”假设 一 副 牌 有 s 


秋 3 


3 


游 


分 


baol 
1 


日 


给 


行 


7.12 ”考察 一 个 nxn 


个 偶数 ) 或 者 从 n 到 1 (如 
二 7.5.3.1 二 105, 而 不 是 


明 : 把 2n 个 物体 分 成 nN 对 ， 共有 (2 (2 人 1)!! 种 方法 . 这 里 的 


的 ， 因 此 {{2, 4}, {1,3}}, {{2, 4}, {3,1}} 和 {{1,3}, {2, 和} 都 


虑 次 序 时 , 把 km 个 人 分 成 每 


! 的 末端 有 多 少 个 0? 


人 一 组 的 ”组 有 多 少 种 方法 


让 


种 花色 , 并 且 每 种 花色 有 张 牌 . 我 们 正在 玩 Aces Up 纸牌 
戏 , 但 现在 每 个 回合 都 有 s 张 牌 . 那么 最 后 s 张 牌 的 花色 各 不 相同 的 概率 是 多 少 ? 

习题 3.7.11 ”考虑 更 一 般 化 的 
NN 张 ; 所 以 , C = sN. 为 了 使 得 最 后 s 张 牌 的 花色 各 不 相 


Aces Up 纸牌 游戏 . 一 共有 C 张 牌 , s 种 花色 , 且 每 种 花色 有 


值 应 该 是 多 少 ? 如 果 最 后 s 张 牌 的 花色 全 相同 呢 ? 
秋 3. 


同 的 概率 达到 最 大 ,s 入 的 


导 | 


的 井 字 游 戏 , 其 中 n 是 偶数 .考虑 到 所 有 对 称 性 , 第 一 步 有 多 


种 不 同 的 走 法 ? 如 果 n 是 奇数 , 情况 又 是 怎样 的 ? 


.7.13 ”通过 列 变 换 和 成 


出 了 252 种 可 能 的 排 法 . 


.7.14 “在 《空当 接龙 》 


对 交换 ,下面 给 出 了 《空当 接龙 》 的 牌 局 个 数 . 请 指出 哪里 有 


E 复 计数 的 问题 并 做 出 解释 . 我 们 一 共有 52 张 牌 , 每 张 牌 
然后 我 们 把 列 分 成 2 组 , 每 组 有 4 列 ; 每 1 组 的 列 都 有 4 种 


都 有 2 个 位 置 可 供 选 择 ; 这 就 


J 能 的 排 法 . 于 是 , 一 共有 252 .41.4! 守 2.6 x 101 种 可 能 的 牌 局 . 


排序 来 构造 无 法 获胜 的 | 


,只 要 没有 出 现 2、8 和 A, 就 可 以 通过 重新 对 每 2 列 的 数 进 
捍 局 . 有 多 少 种 新 的 排序 方法 呢 ? 


(如 果 了 解 《空当 接龙 》 的 游 


戏 规则 , 你 就 知道 这 个 论证 过 程 有 多 难 . 例如 , 只 要 没有 2 和 8, A 就 会 出 现 ; 如 果 把 A 


去 


动 3. 


习题 


习题 3.7.17 ”对 了 
习题 3.7.18 ”假设 从 0 点 开始 ; 


就 
3. 
可 
点 


率 是 g. 在 nn 步 之 后 , 我 们 处 于 位 置 k 的 概率 是 多 少 ? 这 是 


掉 , 那么 游戏 就 结束 了 .) 


7.15 ”在 玩 桥 牌 时 , 假设 你 和 队友 
牌 . 


在 两 个 对 手 之 间 , 这 K 
是 说 , 有 一 个 对 手 拿 到 了 
7.16 个 标准 的 顺 子 


< 有 13 一 kk 张 将 牌 ， | K 张 将 


张 将 牌 是 按照 (k 一 n) 一 n 的 方式 进行 分 配 的 概率 是 多 少 ? 也 
一 n 张 将 牌 , 而 男 一 个 对 手 拿 到 了 n 张 将 牌 . 


是 


由 点 数 连续 的 5 张 牌 (它们 的 花色 不 一 定 相 同 ) 构成 的 ;， A 


以 是 大 有 牌 , 也 可 以 是 小 牌 , 但 不 能 既是 大 牌 又 是 小 牌 . 间隔 顺 的 不 同 之 处 在 于 相 邻 牌 的 


点 数 之 差 是 2( 例 如 , 4, 6,8, 10,Q). 那么 任 取 的 5 张 牌 是 间隔 顺 的 概率 为 多 少 ? 
一 个 固定 的 n, 当 取 什么 值 时 , 二 项 式 系数 (四 能 够 取 到 最 大 值 ? 
我 们 向 右 移动 1 个 单位 的 概率 是 p, 向 左 移动 1 个 单位 的 概 


有 的 是 我 们 位 于 0 点 右 侧 的 
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距离 . (提示 : 分 别 考 虑 n 是 偶数 和 奇数 的 情况 . ) 

习题 3.7.19 ”nn 的 双 阶 乘 被 定义 为 从 1 到 n 或 者 从 2 到 n 且 奇 偶 性 相同 的 全 体 整 数 的 乘 
积 ; 于 是 6 = 6.4.2, 但 71 =7.5.3.1. 我 们 可 以 把 (2n 一 1)1 写 成 al/(b°dl), 其 中 
a,b,c,d 都 取决 于 n; 请 给 出 这 个 漂亮 的 公式 ! (提示 : 其 实 是 个 常数 ; 对 于 所 有 的 n 和 
b 的 取 值 保持 不 变 . ) 

习题 3.7.20 ”在 赛马 中 , 赌注 押 在 赔 率 上 .如 果 你 把 赌注 押 在 赔 率 为 5:1 的 一 匹 马 上 , 那么 
你 每 赌 1 美元 , 获胜 后 都 会 赢得 5 美元 . 为 了 保证 赌局 的 公平 性 , 这 匹 马 获胜 的 概率 应 
该 是 多 少 ? 

习题 3.7.21 ”在 肯塔基 赛马 会 上 有 20 匹 马 . 无 论 你 选择 哪 匹 马 , 每 次 下 注 都 一 样 公平 (或 不 

公平 ! ). 有 一 匹 马 的 赔 率 是 2:1, 另 一 匹 马 的 赔 率 是 5:1, 有 3 匹 马 的 赔 率 都 是 7:1, 有 6 

匹 马 的 赔 率 都 是 20:1, 而 剩 下 9 匹 马 的 赔 率 都 是 50:1. 那么 下 注 1 美元 的 平均 收益 是 多 

2 


| 
习题 3.7.22 “有 一 种 下 注 的 方式 是 赌 三 连 胜 , 此 时 你 要 按 顺 序 挑选 出 排名 前 三 的 马 . 如 果 一 
共有 20 匹 马 参 赛 , 那么 三 连 胜 的 可 能 情况 有 多 少 种 ? 
习题 3.7.23 ”一 种 常见 的 赌博 策略 是 , 对 你 所 选 3 匹 马 的 所 有 可 能 排列 都 下 注 . 求 出 所 需 的 
投注 数量 . 
习题 3.7.24 “教室 里 有 20 个 学 生 在 上 概率 论 课 , 其 中 有 10 个 男孩 和 10 个 女孩 . 他 们 坐 在 
司 一 排 的 20 个 座位 上 那么 男孩 和 女孩 交替 着 坐 的 概率 是 多 少 (假设 座位 是 随机 分 配 
的 )? 
习题 3.7.25 ”教室 里 有 20 个 学 生 在 上 概率 论 课 , 其 中 有 10 个 男孩 和 10 个 女孩 . 他 们 坐 在 
司 一 排 的 20 个 座位 上 . 那么 任意 3 个 男孩 不 相 邻 , 并 且 任 意 3 个 女孩 也 不 相 邻 的 概率 
是 多 少 (假设 座位 是 随机 分 配 的 )? 如 果 教 室 里 有 2m 个 学 生 , 情况 又 是 怎样 的 ? 
习题 3.7.26 ”假设 你 正在 面试 两 家 公司 的 工作 . A 公司 有 三 名 面试 官 , 其 中 两 名 面试 官 同意 
你 入 职 的 概率 都 是 p, 并 且 他 们 的 选择 是 相互 独立 的 . 第 三 名 面试 官 用 一 枚 均匀 的 硬币 
来 做 决定 . 第 二 天 你 去 B 公司 面试 . 现在 只 有 一 个 面试 官 , 他 会 选择 你 的 可 能 性 是 p, 而 
昨天 的 面试 结果 不 会 影响 他 的 决定 . 看 看 哪个 公司 更 有 可 能 雇用 你 . (结果 可 能 取决 于 
p.) 
习题 3.7.27 ”重新 做 上 一 题 , 但 现在 假设 A 公司 的 三 名 面试 官 同意 你 入 职 的 概率 都 是 p, 并 
他 们 的 决定 是 相互 独立 的 (也 就 是 说 , 不 再 用 投掷 硬币 的 方法 做 决定 ). 
人 


习题 3.7.28 ”这 是 一 个 著名 的 问题 : 在 一 个 游戏 节目 中 , 你 要 从 三 扇 门 中 选择 一 扇 ， 有 一 扇 

门 的 后 面 是 你 梦想 的 奖品 , 但 在 另外 两 扇 门 之 后 , 都 放 着 一 堆 垃圾 . 你 选择 了 一 扇 门 , 然 

后 游戏 节目 主持 人 故意 打开 另 一 扇 你 没有 选择 的 门 , 从 而 让 你 总 能 看 到 一 堆 垃 圾 . 那么 你 

会 改变 选择 吗 ? 
习题 3.7.29 “ 双 蜗 子 赌博 需要 两 颗 骨 子 . 在 第 一 个 回合 中 , 如 果 两 个 观 子 的 总 和 为 7 或 11， 
那 你 就 赢 了 . 如 果 它 们 加 起 来 等 于 2、3 或 12, 那 你 就 输 了 . 如 果 它 们 的 和 是 其 他 某 个 值 ， 
那么 这 个 值 就 是 所 谓 的 “点 ”. 当 出 现 这 种 情况 时 , 你 继续 撕 愉 子 直到 两 个 角 子 的 和 等 于 
第 一 个 回合 的 “点 ”或 7. 如 果 先 得 到 了 7, 那 你 就 输 了 ; 如 果 先 得 到 “点 ”, 那 你 就 赢 了 . 
你 赢 的 概率 是 多 少 ? 


l 


习题 3.7.30 。 Cameron 和 Kayla 正在 竞选 大 学 理事 会 的 主席 . 一 共有 NN 个 选民 (N 是 任意 
一 个 固定 的 正 整数 ), 计 票 员 对 选票 进行 逐一 统计 . 那么 Cameron 和 Kayla 的 票数 相等 
的 概率 是 多 少 ? 

习题 3.7.31 ”考虑 两 块 乐高 积木 , 每 块 积木 都 有 6 个 突起 和 6 个 与 突起 相 契 合 的 位 置 . 如 
果 这 两 块 积木 的 颜色 不 同 , 那么 将 它们 组 合 在 一 起 的 独特 方法 有 多 少 种 . ( 记 住 各 种 对 称 
性 ! ) 假设 积木 必须 按照 正确 的 角度 来 连接 . 

习题 3.7.32 ”重新 做 上 一 题 , 但 现在 假设 两 块 积木 没有 任何 区 别 . 

习题 3.7.33 ”编写 一 个 程序 , 从 实验 角度 验证 我 们 通过 模拟 算出 的 不 同 扑 克 牌 型 的 概率 是 正 
确 的 . 

习题 3.7.34 ”在 计算 有 一 个 玩家 拿 到 了 13 张 同 花 色 牌 的 过 程 中 , 我 们 面临 的 挑战 是 : 有 效 地 
验证 这 四 个 玩家 中 是 否 有 一 个 拿 到 了 13 张 相 同 花 色 的 牌 . 虽然 我 们 一 直 用 1、2、3 和 4 
来 表示 花色 , 但 还 有 一 个 更 好 的 办 法 : 把 花色 表示 成 1、100、10 000 和 1 000 000. 证 明 : 
某 人 拿 到 13 张 相 同 花 色 的 牌 , 当 且 仅 当 他 手中 所 有 牌 的 花色 之 和 等 于 13、1300、130 000 
或 13 000 000. 如 果 把 花色 表示 成 1、10、100 和 1000, 上 述 结论 还 成 立 吗 ? 能 否 用 0 来 
表示 某 种 花色 ? 


T 


bo 
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C-3P0: 长 官 , 成 功 飞越 小 行星 带 的 概率 大 约 是 1/3720. 
汉 索 洛 : 永远 不 要 告诉 我 机 会 有 多 大 . 
一 一 《星球 大 战 5: 帝国 反击 战 》(1980) 


我 们 已 经 讲 过 如 何 计算 事件 的 概率 . 在 第 2 章 中 , 我 们 将 重点 放 在 了 这 门 课 的 
基础 上 一 一 公理 以 及 一 些 最 重要 的 结果 . 在 第 3 章 中 , 我 们 继续 把 这 些 结果 应 用 
到 一 些 典 型 问题 上 . 这 些 问 题 主要 来 自 于 纸牌 游戏 , 因为 纸牌 游戏 非常 有 趣 , 而 且 
在 概率 的 发 展 中 起 着 重要 的 作用 , 但 我 们 也 可 以 借鉴 其 他 领域 的 一 些 例子 . 

当 研 究 这 些 问 题 时 , 我 们 遇 到 了 困难 . 我 最 喜欢 3.4.3 节 中 将 牌 的 分 配 . 我 们 给 
bh 了 两 种 不 同 的 方法 , 详细 讨论 了 为 什么 第 二 种 方法 失败 了 , 并 承诺 要 回 过 头 来 重 
考察 这 一 点 . 现在 是 兑现 承诺 的 时 候 了 . 为 什么 第 三 种 论证 失败 了 ? 它 似 乎 是 合 
的 , 看 起 来 像 是 基于 一 个 坚实 的 基础 , 即 每 张 牌 都 等 可 能 地 发 给 每 个 玩家 哪里 
出 错 了 ? 

事件 不 是 孤立 的 , 某 个 事件 的 发 生 会 对 另 一 个 事件 发 生 的 概率 产生 影响 . 在 计 
算 时 , 我 们 经 常 得 到 额外 信息 ; 在 已 知 其 他 事件 发 生 的 前 提 下 , 我 们 想 知 道 某 个 
件 发 生 的 概率 有 多 大 . 这 就 是 所 谓 的 条 件 概 率 . 我 们 希望 利用 更 多 的 基本 结果 来 找 
到 条 件 概率 的 简单 公式 , 并 为 此 花费 了 大 量 时 间 , 但 这 样 做 是 有 充分 理由 的 . 显然， 
第 一 点 是 我 们 要 有 能 力 找到 这 些 概率 ! 目前 , 第 二 点 并 不 很 清楚 , 却 更 重要 . 我 们 
将 详细 讨论 怎样 合理 地 猜测 答案 , 以 及 如 何 检验 答案 , 在 此 之 后 才 会 痰 到 证 明 . 随 
着 学 习 的 不 断 深入 , 无 论 是 在 课堂 上 还 是 在 工作 中 , 你 最 终 会 来 到 知识 领域 的 边缘 . 
接 下 来 就 要 看 你 自己 了 ! 为 了 为 那个 有 趣 (但 有 点 可 怕 ) 的 日 子 做 好 准备 , 我 们 将 
持续 讨论 如 何 看 待 这 些 公式 . 思维 过 程 非常 重要 , 而 这 项 技能 却 很 少 得 到 练习 . 大 
多 数 时 候 , 我 们 只 是 写 出 公式 或 方程 . 这 就 像 摩西 回 到 西奈 山 , 并 且 从 那里 带 回 
刻 着 数学 和 科学 准则 的 石碑 “. 我 们 的 目标 是 帮助 你 为 将 来 的 探索 做 好 准备 . 

为 了 引入 条 件 概率 , 我 们 先 热 热身 , 看 看 下 面 这 个 问题 . 三 名 学 生 进入 了 一 个 
房间 , 他 们 每 人 头 上 都 戴 着 一 顶 白色 或 黑色 的 帽子 . 每 顶 帽子 的 颜色 都 是 通过 抛掷 
一 枚 均匀 的 硬币 来 决定 的 , 并 且 抛 搓 一 枚 硬币 的 结果 对 另 一 枚 硬币 没有 任何 影响 . 
因此 , 对 每 个 学 生来 说 , 他 戴 两 种 颜色 帽子 的 概率 是 相等 的 , 而 且 这 三 名 学 生 是 相 


ee 


stk 


fea: 


@ 《圣经 ) 记载 , 上帝 在 西奈 山 将 刻 有 “十 诚 ” 的 石碑 赐 给 摩西 . 一 编者 注 
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互 独立 的 . 每 个 人 都 能 看 到 其 他 
会 话 外 , 任何 形式 的 交流 都 
子 , 他 们 就 必须 马上 猜 出 自己 帽子 的 颜色 


一 个 初始 策 


而 人 的 | 


上 昌 子 ,但 看 不 到 自己 的 . 除了 游戏 开始 前 的 


是 不 允许 的 . 一 旦 有 机 会 看 到 其 他 人 的 帆 
或 者 弃权 . 如 果 至 少 有 一 个 人 猜 对 且 没 人 


诸 错 的 话 , 那么 他 们 就 能 共享 300 万 美元 奖金 . 如 果 只 有 一 个 人 说 话 且 坚持 说 是 白 


以 正确 的 概率 应 该 


色 , 那么 他 们 就 有 一 半 的 机 会 获胜 . 令 人 


在 可 以 停 下 来 自由 地 思考 一 下 这 个 问题 . 


荆 


惊讶 的 是 , 他 们 还 可 以 做 得 更 好 , 从 而 使 得 
获胜 概率 比 50% 更 大 . 这 看 起 来 很 令 人 吃惊 , 因为 每 个 人 都 看 不 见 自己 的 帽子 , 所 
只 有 一 半 ! 稍 后 , 我 们 } F 


各 在 4.2.3 节 中 再 次 讨论 这 个 问题 , 但 是 现 


4.1 条 件 概率 


无 论 在 概率 论 课 上 还 是 在 现实 生活 中 , 我 们 总 想 知 道 某 个 事件 发 生 的 概率 . 比 


如 , 假设 你 计划 今年 4 
这 个 例子 在 几 年 后 可 能 会 更 有 意义 . 丸 


日 在 费城 举办 一 场 户外 婚礼 , 可 能 想 知 道 下 雨 的 概率 (好 吧 ， 
1 果 愿 意 的 话 , 不 妨 假 设 自己 想 去 费城 看 棒球 


赛 ). 你 可 以 把 费城 去 年 的 雨天 总 数 除 以 365, 但 这 是 最 好 的 方法 吗 ? 费城 在 4 月 的 


降雨 量 通常 比 其 他 月 
们 想 知道 (或 估计 )4 


份 要 多 , 所 以 使 用 
昌 的 天 气 情况 ; 更 


全 年 的 平均 降雨 量 并 不 会 有 太 大 的 帮助 . 我 
具体 地 说 , 想 知 道 4 月 下 十 的 可 能 性 . 在 已 


知 某 个 事件 的 前 提 下 , 我 们 考察 的 焦点 会 集中 在 样本 空间 的 一 个 子 集 上 ; 这 类 概率 


被 称 为 条 件 概率 , 记 作 Pr(4 


的 是 : 在 事 伯 


B), 读 作 “ 已 知 B 时 4 的 概率 ”. 换言之 , 这 个 概率 指 


F B 己 经 发 生 的 前 提 下 , 事件 4 发 生 的 概率 . 
条 件 概 率 随处 可 见 . 考虑 下 列 可 能 的 应 用 . 


。 体育 运 动 方面 : 


在 一 场 足球 (美国 人 所 说 的 英 式 足球 ) 比赛 中 , 已 知 埃 弗 顿 


队 在 第 75 分 钟 时 以 1 一 0 落后 , 那么 他 们 获胜 的 概率 有 多 大 ? 对 一 个 橄榄 球 
队 来 说 , 已 知 这 是 它 的 第 四 次 进攻 机 会 , 那么 该 队 能 再 次 取得 第 一 次 进攻 机 


会 的 概率 是 多 少 ? 如 果 一 个 


| 棍 球 队 已 经 换 下 了 门将 , 那么 该 队 得 分 的 可 能 


性 是 多 少 ? J. D. 德 鲁 所 在 的 棒球 队 能 打出 4 个 连续 本 刍 打 的 概率 有 多 大 ? 
如 果 该 队 没有 J. D. 德 鲁 , 情况 又 是 什么 样 的 ?” 

。 医 疗 保健 方面: 对 于 一 个 65 岁 
多 少 ? 在 已 知 前 两 种 药物 都 无 效 的 前 提 下 , 第 三 种 药物 能 治 好 病人 的 概率 是 


不 吸烟 的 病人 来 说 , 他 得 心脏 病 的 概率 是 


多 少 呢 ? 我 刚 做 完 一 种 罕见 病 的 测试 且 结 果 是 阳性 , 那么 我 得 这 种 疾病 的 可 
能 性 有 多 大 ? 

。 政治 方面 : 在 民意 测试 中 , 她 已 经 得 到 了 53% 的 选票 , 那么 她 在 选举 中 胜出 
的 概率 是 多 少 ? 

@ 截至 2017 年 , 这 种 情况 只 出 现 过 7 次 ; 其 中 有 两 次 J. D. 德 鲁 都 是 4 名 击 球 手 之 一 (有 趣 的 是 ， 


他 每 次 都 打出 第 二 个 本 鱼 打 ). 所 以 , 如 果 想 确保 有 连续 的 本 人 垒 打 , 那么 .……… 


这 些 问 题 的 共同 之 处 在 于 : 我 们 可 以 利用 已 知 信息 把 一 般 的 概率 问题 (她 在 选 
举 中 获胜 的 概率 是 多 少 ? ) 转化 成 一 个 更 具体 的 问题 (在 知道 了 民意 测试 的 数据 后 ， 
她 在 选举 中 获胜 的 概率 是 多 少 ? ). 这 些 都 涉及 条 件 概率 . 如 果 你 此 时 正在 思考 “我 
们 不 是 总 有 一 些 可 用 的 额外 信息 吗 ?”, 那么 你 的 想法 是 完全 正确 的 . 在 很 多 方面 ， 
条 件 概 率 都 是 最 常见 且 应 用 最 广泛 的 概率 形式 .因此 , 知道 如 何 应 用 它 是 非常 重 
要 的 . 

我 们 再 举 一 个 例子 . 在 童年 时 代 , 我 经 常 和 奶奶 一 起 看 The Price is Right( 对 
我 的 孩子 们 来 说 , 它 堪 比 伟 大 的 格 莱 美 奖 ). 许多 游戏 都 涉及 大 量 的 概率 问题 , 但 有 
一 个 环节 很 好 地 说 明了 条 件 概率 , 即 大 转盘 游戏 . 三 个 人 依次 转动 大 转盘 (参见 图 
4-1). 在 这 个 转盘 上 共有 21 个 数 , 分 别 表 示 从 0 美元 开始 , 以 5 美 分 为 增 量 直到 1 
美元 的 21 个 不 同 价格 . 每 个 玩家 最 多 可 以 转动 两 次 ， 如果 你 转动 了 两 次 , 那么 得 
分 就 是 两 次 转动 转盘 的 数 之 和 . 得 分 最 接近 且 不 超过 1 美元 的 玩家 获胜 . 我 们 正在 
上 概率 论 课 , 而 不 是 站 在 人 声 喧 闸 的 舞台 上 , 所 以 不 需要 担心 出 现 平 局 的 情况 . 不 
妨 设 我 们 先 转 动 . 第 一 次 转动 得 到 的 数 满足 什么 样 的 分 布 ? 第 二 次 的 数 又 是 什么 情 
况 ? 对 于 两 次 转动 得 到 的 结果 , 其 概率 分 布 是 不 一 样 的 . 如 果 第 一 次 的 数 较 小 , 比 
如 10, 那么 我 们 会 试 着 在 第 二 次 转动 时 得 到 90 附近 的 数 , 这 样 才 有 机 会 接近 1 美 
元 . 如 果 第 一 次 的 数 较 大 , 我 们 有 可 能 选择 不 再 转动 ! 现在 假设 我 们 是 第 三 个 玩家 ， 
那么 数 之 和 会 满足 什么 样 的 分 布 ? 这 显然 取决 于 前 两 个 玩家 的 得 分 情况 . 如 果 前 两 
个 玩家 的 得 分 都 超过 了 1 美元 , 那么 第 三 个 玩家 就 无 须 转 动 两 次 , 此 时 第 三 个 玩家 
的 得 分 不 可 能 超过 1 美元 ; 然而 , 如 果 前 两 个 玩家 的 最 高 分 是 95 分 , 那么 第 三 个 
玩家 不 得 不 转动 两 次 且 得 分 超过 1 美元 的 可 能 性 非常 大 . 


图 4-1 The Price is Right 节目 中 的 大 转盘 . 图 像 版 权 属 
于 © the Pittsburgh Cultural Trust 
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4.1.1 猜测 条 件 概率 公式 


现在 , 有 两 件 事 是 明确 . 首先 , 条 件 概率 是 有 用 的 , 很 多 地 方 都 会 有 所 涉及 . 其 
次 , 我 们 需要 找到 计算 条 件 概率 的 方法 ! 实际 上 , 我 们 有 点 贪心 , 想 要 的 不 仅仅 是 
计算 条 件 概率 的 方法 ,而 且 想 找到 一 个 好 的 计算 方法 当 提 到 条 件 概 率 Pr(4|B) 
时 , 什么 方法 才 算 好 呢 ? 这 里 的 好 指 的 是 用 较 简单 的 事件 来 表示 一 个 漂亮 简洁 的 


公式 


在 给 出 这 个 公式 之 前 , 我 们 先 看 看 能 否 找 出 它 的 一 些 特征 .在 本 章 的 导言 中 ， 


我 们 讨论 了 为 什么 要 花 时 间 来 预测 答案 的 形式 . 在 开始 论证 之 前 , 你 应 该 先 试 着 找 
出 一 个 公式 . 如果 你 对 它 的 特点 有 一 定 的 了 解 , 那么 不 仅 能 经 常 发 现 错误 , 够 幸运 
的 话 还 能 领悟 到 该 如 何 证 明 . 第 一 个 猜测 是 , Pr(41B) 很 有 可 能 与 下 面 两 个 基本 事 
件 的 概率 有 关 , 即 Pr(4) 和 Pr(B). 

有 没有 可 能 存在 一 个 合适 的 函数 ,使 得 


Pr(A|B) = F(Pr(A), Pr(B))? 


不 可 能 ! 为 什么 呢 ? 要 始终 关注 极端 情况 . 一 种 情况 是 , 让 4 等 于 B; 另 一 种 情况 
是 , 让 4 等 于 B°( 参 见 B 的 补 集 , 或 者 B 不 发 生 的 事件 ). 这 些 都 是 很 自然 的 情况 ， 
它们 是 4 和 B 充分 接近 或 充分 远离 时 的 情况 . 此 外 , 我 们 要 选择 那些 容易 计算 条 
件 概率 的 4 和 B, 而 且 (我 们 稍 后 会 看 到 ) 这 些 选择 是 非常 好 的 . 在 其 他 许多 问题 
中 , 尝试 利用 整个 空间 Q 和 空 集 Cg 是 个 不 错 的 主意 . 遗憾 的 是 , 在 这 里 它们 并 不 会 
带 给 我 们 帮助 . 
我 们 要 为 所 有 的 概率 赋值 . 最 简单 的 情形 是 所 有 事件 的 概率 相等 : Pr(4) 
Pr(B) = Pr(B°). 由 于 Pr(B) +Pr(B°) = 1, 因此 这 3 个 事件 的 概率 都 是 1/2. 村 


人 | 


1= Pr(BIB) = F(1/2,1/2) = Pr(B°|B) = 0. 


为 了 看 清 这 一 点 , 请 大 声 朗 读 这 些 语句 . 我 们 把 Pr(B|B) 读 作 : 已 知 B 发 生 时 , B 
发 生 的 概率 ; 它 只 能 是 1. 同样 地 , Pr(B°|B) 是 已 知 B 发 生 时 , B 不 发 生 的 概率 ; 
它 就 是 0. 如 果 答 案 只 取决 于 Pr(4) 和 Pr(B), 而 与 事件 4 和 B 的 本 质 无 关 ， 
么 Pr(B|B) 就 必须 等 于 Pr(B°|B), 这 是 很 总 雇 的 . 我 们 已 经 证 明了 条 件 概率 一 
与 Pr(4) 和 Pr(B) 之 外 的 东西 有 关 . 只 考察 了 一 种 极端 情况 , 我 们 就 得 到 了 一 Re 
当 好 的 回报 . 

0 虽然 还 没有 给 出 公式 , 但 我 们 已 经 知道 它 一 定 不 是 什么 . 现 
在 来 看 看 它 是 什么 .我们 知道 , 答案 肯定 不 是 只 与 Pr(4) 和 Pr(B) 有 关 的 函数 . 
那么 还 有 什么 呢 ? 我 们 再 读 一 遍 这 个 表达 式 : 己 知 B 时 4 的 概率 . 这 意味 着 4 
和 B 都 要 发 生 , 所 以 我 们 应 该 把 Pr(4 mn B) 也 考虑 进来 , 然后 再 寻找 下 列 形 式 的 


公式 
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Pr(A|B) = G(Pr(A), Pr(B), Pr(AN B)) 

( 记 住 , 交集 意味 着 两 者 同时 发 生 ). 另外 , 我 们 还 有 

。 Pr(B|B)=1, 

。Pr(B°|B) = 0, 并 且 

。 0<Pr(AIB)<L. 

条 件 概 率 公 式 是 由 满足 这 三 条 性 质 的 三 个 基本 概率 构成 的 ,由 此 我 们 得 到 一 
个 简单 的 表达 式 : Pr(4n B)/Pr(B)( 这 里 假设 Pr(B) > 0; 但 要 注意 当 Pr(B) = 0 
时 , Pr(4 nn B) 也 等 于 0, 此 时 表达 式 就 变 成 了 0/0 的 不 定式 )， 如 果 4 = B, 那 
么 Pr(4|B) = 1; 如 果 4 = Be, 那么 Pr(4|B) = 0. 另外 , 因为 4Nn Bc B, 所 以 
Pr(4nB)/Pr(B) 会 始终 介 于 0 和 1 之 间 . 我 们 将 在 习题 中 解释 如 何 得 出 这 个 猜想 
(也 可 以 参阅 2.7 节 , 以 了 解 更 多 相关 内 容 ), 但 现在 来 看 一 个 例子 , 看 看 我 们 是 如 何 
进行 猜测 的 . 
4.1.2 ”期 望 计数 法 

我 们 将 使 用 一 种 叫 作 期 望 计数 法 的 方法 . 假设 某 天 你 出 去 钓鱼 , 并 制定 了 以 下 
规则 : 一 旦 钓 到 鱼 或 者 已 经 等 待 了 4 个 小 时 (不 管 哪 种 情况 先 发 生 ), 就 停止 钓鱼 . 另 
外 , 假设 你 钓 到 鲜 鱼 的 概率 是 40%, 钓 到 鲈鱼 的 概率 是 25%, 而 没有 钓 到 鱼 的 概率 是 
35%. 注意 , 这 些 百 分 比 之 和 是 100%, 而 且 你 一 天 内 最 多 钓 到 一 条 鱼 . 如 果 我 们 知 
道 有 一 天 你 钓 到 了 一 条 鱼 , 那么 这 条 鱼 是 鲁 鱼 的 概率 是 多 少 ?假设 你 钓 了 1000 次 鱼 
(我 们 很 快 就 会 知道 为 什么 选择 1000 这 个 数 ), 那么 我 们 预测 有 400 次 钓 到 了 鲜 鱼 ， 
250 次 钓 到 了 鲈鱼 , 还 有 350 次 空手 而 归 . 如 果 已 知 你 钓 到 了 一 条 鱼 , 那么 这 条 鱼 是 
鲜 鱼 的 概率 是 多 少 ? 我 们 现在 把 范围 限制 在 你 钓 到 鱼 的 650 次 上 , 其 中 恰 有 400 次 
钓 到 了 鲜 鱼 . 因此 , 被 钓 到 的 这 条 鱼 是 鲜 鱼 的 概率 为 400/650, 约 等 于 61.5%. 为 了 验 
证 我 们 的 公式 , 设 4 表示 钓 到 了 一 条 鲤鱼 , B 表示 钓 到 了 一 条 鱼 , 那么 Pr(4) = 0.40， 
Pr(B) = 0.40 十 0.25 = 0.65, Pr(4mn B) = 0.40( 如 果 4 发 生 , 这 意味 着 我 们 已 经 钓 
到 了 一 条 鱼 , 此 时 B 肯定 发 生 了 ). 这 表明 了 Pr(4nB)/Pr(B) = 0.40/0.65, 也 就 是 
400/650, 这 恰好 等 于 之 前 的 答案 ! 

期 望 计数 法 是 可 行 的 , 因为 所 有 的 概率 都 按 比 例 放 大 了 相同 的 倍数 . 我 们 没有 
写 400 和 200, 而 是 写成 1000 . Pr( 鳞 鱼 ) 和 1000 . Pr( 鲈 鱼 ). 为 什么 要 写成 这 种 形 
式 呢 ? 主要 原因 是 : 与 记忆 公式 的 方法 相 比 , 期 望 计数 法 能 够 更 加 直观 地 解决 条 件 
概率 问题 . 与 其 求 概率 的 比值 , 不 如 考虑 每 个 事件 发 生 的 期 望 次 数 , 然后 对 它们 取 
恰当 的 比值 . 在 钓鱼 的 例子 中 , 钓鱼 的 总 次 数 1000 完全 是 随意 选取 的 , 也 可 以 随便 
另 选 一 个 数 . 选择 1000 是 因为 它 能 使 所 有 的 期 望 值 都 是 整数 . 一 般 情况 下 , 我 们 会 
选择 一 个 较 大 的 数 , 而 且 这 个 数 要 能 被 题目 中 的 所 有 数 整 除 . 

我 们 使 用 的 另 一 种 方法 是 直接 计算 概率 的 比值 . 假设 有 两 个 事件 4 和 B, 我 
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们 想 知 道 Pr(4|B) 是 多 少 ， 如 表 41 所 示 , 构造 这 样 的 表格 会 对 我 们 产生 很 大 


表 4-1 ”关于 事件 4 和 B 的 可 能 结果 . 如 果 已 知事 件 BB 发 生 , 那么 只 需 考 察 B 所 在 


行 的 事件 就 行 了 

A A 
B ANMB A°NB 
Be° ANB° A°NBe° 


如 果 只 考察 关于 4 和 B 的 可 能 结果 , 那么 这 样 的 结果 有 4 个 . (注意 , 4* 和 
Be 分 别 表示 “4 不 发 生 ” 和 “B 不 发 生 ”.) 但 是 , 如 果 已 知事 件 B 发 生 , 那么 我 
们 的 考察 范围 就 限定 在 表 41 中 B 所 在 的 行 上 . 此 时 , 可 能 的 结果 只 有 4m 和 
A B. 于 是 , 条 件 概率 Pr(4|B) 由 下 面 的 式 子 给 出 

加 Pr(ANB) _ Pr(4NB) 
Pr(AlB) = BHANB) HPN(ANMB) 一 ~ Pr(B) 

最 后 一 个 等 号 之 所 以 成 立 是 因为 (4n B)U (A4°nB)= B, 而 且 对 于 两 个 互 不 相交 
的 集合 的 并 , 其 概率 就 是 两 个 概率 之 和 (这 是 概率 公理 之 一 ). 

现在 我 们 把 结果 记录 下 来 . 


条 件 概率 : 设 B 是 满足 条 件 Pr(B) > 0 的 事件 . 那么 已 知 B 时 4 的 条 件 概率 就 


等 于 


Pr(4IB) = Pr(AN B)/Pr(B). (4.1.2) 


如 果 仔 细 阅 读 , 你 可 能 会 注意 到 上 面 的 叙述 多 了 一 个 新 条 件 : Pr(B) > 0， 当 
Pr(B) = 0 时 , 事件 B 不 可 能 发 生 . 如 果 B 不 可 能 发 生 , 那么 讨论 已 知 B 发 生 时 
4 发 生 的 概率 是 没有 意义 的 ! 幸运 的 是 , 当 Pr(B) =0 时 Pr(4mB) 也 等 于 0, 这 样 
就 得 到 了 一 个 不 确定 的 比值 0/0, 它 警 告 我 们 正 处 在 危险 的 边缘 . 

虽然 我 们 对 这 个 公式 的 合理 性 进行 了 长 时 间 的 讨论 , 但 还 有 一 点 值得 研究 . 条 
件 概率 公式 实际 上 是 对 正则 概率 的 推广 ! 我 们 可 以 把 Pr(4) 看 作 Pr(4|0); 由 于 9 
总 会 发 生 , 所 以 已 知 8 发 生 时 4 的 概率 不 会 有 任何 变化 . 确切 地 说 , 由 9 是 结果 
空间 可 得 Pr(9) = 1. 在 数学 中 , 任何 表达 式 都 可 以 乘 以 1. 学 习 如 何 做 好 这 一 点 是 
最 重要 也 是 最 难 的 技能 之 一 . 乘 以 1 是 种 强大 的 技巧 , 利用 该 技巧 , 我 们 能 把 代数 
表达 式 写 成 更 容易 处 理 或 者 更 具 启 发 性 的 形式 . 就 条 件 概率 而 言 , 因为 4= 4nm， 
所 以 


Pr(ANMQO) Pr(ANO) 

1 Pr(0) 
注意 , 最 后 一 个 表达 式 就 是 条 件 概 率 公 式 ! 所 有 这 些 都 是 为 了 帮助 我 们 看 到 (再 次 
看 到 ! ) 条 件 概 率 公式 从 何 而 来 , 同时 让 我 们 通过 思考 来 获得 经 验 , 以 便 将 来 能 找 


Pr(A)= 
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到 类 似 的 公式 . 
4.1.3” 文 氏 图 法 


我 们 看 一 些 条 件 概 率 的 例子 . 
例子 : 在 某 个 城镇 里 , 一 个 成 年 人 拥有 汽车 或 房子 的 概率 是 90%. 如 果 有 70% 


的 成 年 人 拥有 汽车 ， 


汽车 的 概率 是 多 少 ? 


解答 : 首先 考虑 一 下 , 我 们 真 
个 拥有 房子 的 成 年 人 也 有 一 辆 车 的 概率 . 可 以 把 它 重新 写成 : 
拥有 房子 的 前 提 下 , 他 /她 有 一 多 


E 想 找 的 是 表 


件 B 表示 拥有 一 套房 子 , 我 们 想 
Pr(4n B)/Pr(B). 我 们 已 经 知道 Pr(B) = 0.5, 所 以 只 需要 求 吕 
不 幸 的 是 , 我 们 不 知道 Pr(4 Nn B) 是 多 少 , 即 某 人 同时 拥有 房子 和 汽车 的 概率 . 因 
为 不 知道 这 个 概率 , 所 以 无 法 


但 是 还 有 一 线 和 希望 ， 


汽车 的 概率 . 


利用 条 件 概 率 公式 . 
因为 Pr(4U B) = 0.90. 既然 我 们 已 经 知道 了 某 人 人才 


子 或 汽车 (或 两 者 兼 有 ) 的 概率 , 那么 根据 


了 个 概率 . 简 旭 


用 事件 4 表示 
求 的 就 是 Pr(4|B). 由 式 (4.1.2) 可 


有 50% 的 成 年 人 拥有 房子 , 那么 一 个 拥有 房子 的 成 年 人 也 拥有 


地 说 , 我 们 想 计算 一 
在 已 知 某 个 成 
有 一 辆 汽车 ， 

[ 知 , Pr(4|B) = 


年 人 
用 事 


H Pr(An B) 就 行 了 . 


有 房 


Pr(AUB)= Pr(A)+Pr(B)— Pr(ANMB)=0.7+0.5— Pr(ANB) 
就 可 以 求 出 Pr(A4NB). 因为 Pr(4U B) = 0.9, 所 以 Pr(4n B) = 0.3. 现在 , 我 们 就 


能 利用 式 (4.1.2) 来 计算 条 件 概率 了 . 


Pr(AN B)/Pr(B) = 0.3/0.5 = 0.6. 


我 们 面 一 张 文 氏 医 
上 , 教授 都 曾 说 过 ;“ 夯 一 张罗 


个 拥有 房子 的 成 名 


分 别 表示 图 42 中 4 个 区 域 的 概率 . 


图 42 ( 左 图 ) 房 


主 和 汽车 问题 的 文 氏 图 


的 概率 讨论 . 为 此 , 我 


三 
里 


, 从 而 使 这 个 问题 更 加 形象 化 (图 4-2)， 几乎 在 所 有 数 
.” 教 授 可 能 只 是 顺便 提 到 这 个 建议 ; 也 可 能 会 为 
你 留意 这 一 点 而 跳 起 来 向 你 扔 粉笔 . 不 管 是 哪 种 情况 , 都 请 记 但 
就 可 能 犯错 . 通常 , 只 画 一 张 图 就 足以 突显 
充分 体现 出 对 事件 4 和 B 


(w, 2， 2， 2); 


. ( 右 图 ) 把 范围 


限制 到 


上 有 


房子 的 人 群 上 


FE 人 也 拥有 汽车 的 概率 是 


学 课 


卫 让 


FE 这 个 建议 ; 忽视 它 
不 同 的 关系 . 我 们 要 做 的 是 , 在 文 氏 图 中 
门 引 入 新 的 变 


它们 
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在 这 里 , x 指 的 是 只 拥有 汽车 的 人 的 百分比 , z 表示 只 拥有 房子 的 人 的 百分比 ， 
而 y 表示 同时 拥有 房子 和 汽车 的 人 的 百分比 , 最 后 的 w 指 的 是 既 没 有 房子 也 没有 
汽车 的 人 的 百分比 . 因此 


ww 二 TX 十 Yy 十 ZZ 二 1. 
就 这 个 问题 而 言 , Pr(4) = z+y, Pr(B)=y+z, 且 Pr(ANB)=y. 
虽然 这 是 个 好 的 开始 , 但 也 显然 上 只是 个 开始 而 已 , 因为 我 们 想 知 道 wz,y 和 > 
分 别 是 多 少 . 利用 题目 给 出 的 信息 , 可 以 写 出 这 些 变量 之 间 的 关系 式 . 例如 , 我 们 
知道 90% 的 人 拥有 房子 或 汽车 , 这 可 以 写成 z 十 y 十 z == 0.9. 类 似 的 论证 可 以 得 出 
下 列 等 式 : 


和 十 yy 十 2 一 0.9 (4.1) 
2 十 y 三 0.7 (4.2) 
/十 2 三 0.5. (4.3) 


求解 这 个 方程 组 有 很 多 种 方法 , 由 此 可 以 得 出 z,y 和 z 的 值 . 让 式 (4.1) 减 去 式 
(4.2) 得 到 了 z = 0.2. 然后 让 式 (4.1) 减 去 式 (4.3) 可 以 得 到 x = 0.4. 现在 就 能 求 出 
y 的 值 了 , 即 0.3. 于 是 , 方程 组 的 解 是 


T=0.4 
y= 0.3 
2 = 0.2. 


因此 , 一 个 人 同时 拥有 房子 和 汽车 的 概率 是 0.3， 在 已 知 某 人 拥有 房子 的 前 提 下 ， 
他 /她 有 一 辆 汽车 的 条 件 概 率 就 是 y/(y+z)( 因 为 Pr(B) = y+z). 我 们 求 出 Pr(4|B) = 
0.3/(0.3 + 0.2) = 0.6. 

这 个 问题 理解 起 来 容易 还 是 困难 ? 虽然 我 们 按照 标准 做 法 把 变量 依次 标记 为 
(z,y,…), 或 者 把 集合 依次 标记 为 (4, B,…), 但 这 个 论证 还 是 很 难 理解 , 因为 我 们 
必须 记 住 每 个 参数 代表 了 什么 ,一 种 解决 方案 是 使 用 描述 性 名 称 . 我 们 可 以 使 用 
2 汽车 , 但 这 可 能 引起 混淆 : 它 代表 的 是 有 汽车 的 人 , 还 是 只 有 汽车 的 人 ? 我 们 还 可 
以 使 用 zn 右 汽车 ; 但 标签 又 太 长 了 ! 对 于 所 讨论 的 事物 , 我 们 可 以 用 其 名 称 的 首 字 
母 作 为 参数 : 用 C( 即 car) 来 代替 4, 用 五 ( 即 house) 来 代 奉 B. 我 们 有 必要 花 些 
时 间 去 考虑 变量 名 , 而 不 是 按 字母 顺序 依次 给 出 , 因为 好 的 符号 可 以 使 论证 更 容易 
理解 . 


4.1.4 ” 蒙 提 替 尔 问题 


下 面 是 一 个 著名 的 问题 , 人 们 已 经 对 它 展开 了 大 量 的 讨论 . 这 个 例子 很 好 地 说 
明了 概率 论 在 流行 文化 中 是 如 何 发 挥 作 用 的 . 
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例子 一 一 蒙 提 霍 尔 问题 : 假设 你 正在 参加 一 个 游戏 节目 . 在 这 个 游戏 中 , 你 
可 以 在 三 鹿 门 之 间 做 出 选择 , 而 且 可 以 使 走 这 扇 门 后 的 东西 . 一 扇 门 的 后 面 是 一 辆 


的 名 字 来 自 于 游戏 节目 


新 车 , 但 另外 两 扇 门 之 后 都 是 山羊 . 在 你 选 定 了 一 扇 门 之 后 


(不 妨 记 作 1 号 门 ), 区 


主持 人 会 打开 2 号 门 , 此 时 , 你 会 看 到 在 2 号 门 的 后 面 是 
人 将 允许 你 继续 保持 最 初 的 选择 , 或 者 


只 山羊 . 之 后 , 主持 


EE 新 选择 3 号 门 . 你 会 怎么 做 呢 ? (这 个 问题 
Let’s Make 4 Deal, 其 最 初 的 主持 人 就 是 蒙 提 霍 尔 .) 


解答 : 除非 你 更 喜欢 山羊 而 不 是 汽车 , 否则 就 应 该 重新 选择 最 初 没有 选 的 那 局 
门 . 这 个 不 太 直 观 的 答案 可 以 通过 条 件 概 率 来 更 好 地 理解 . 非常 重要 的 一 点 是 , 我 


们 要 明确 一 个 隐藏 的 假设 : 当 你 没有 
开 有 汽车 的 那 扇 门 (如 果 他 打 


扇 门 , 那么 蒙 提 霍 尔 只 有 唯 
堆 尔 就 可 以 打开 剩 下 两 扇 门 中 的 任意 一 扇 . 在 继续 阅读 之 前 , 请 思考 


意味 着 你 应 该 重新 选择 . 


在 第 一 次 选择 时 , 你 能 


选择 有 汽车 的 那 扇 门 时 , 蒙 握 堆 尔 将 不 会 打 


, 那 就 没什么 悬念 了 , 你 也 不 需要 
样 的 电视 节目 是 很 乏味 的 , 所 以 这 种 情况 不 会 发 生 ). 因此 , 如 果 你 没有 选择 汽车 那 


做 任何 决定 . 这 


的 选择 ; 但 如 果 你 选择 了 有 汽车 的 那 扇 门 , 蒙 提 


下 为 什么 这 


选中 有 汽车 的 那 扇 门 的 概率 是 1/3， 如 果 不 换 门 , 那么 


你 赢得 汽车 的 概率 仍然 是 1/3. 当 看 到 主持 人 打开 的 2 号 门 有 一 上 只 山羊 后 , 我 们 考 


虑 3 号 门 后 是 一 辆 汽车 的 概率 . 设 事件 4 表示 3 号 门 之 后 
了 2 号 门 , 那么 由 条 件 概率 公式 可 得 

_ Pr(ANB) 1/3 2 
1/2 3 

因此 , 如 果 你 能 利用 条 件 概 率 的 知识 去 选择 打开 另 一 扇 门 , 那么 赢得 汽车 的 概率 将 


未 主持 人 扩 


Pr(A|B) = 


从 1/3 提高 到 2/3! 


4.2.1 ”陈述 


Pr(B) 


4.2 ”一 般 乘 法 法 则 


由 式 (4.1.2) 可 以 推出 男 一 个 绪论, 即 一 般 乘法 法 则 . 


是 一 辆 汽车 , 事件 B 表 


一 般 乘 法 法 则 : 我 们 有 


Pr(ANMB)= Pr(A|B).: Pr(B). 


已 知 B 时 , 4 的 条 件 概率 乘 以 B 的 概率 就 得 到 了 上 面 这 个 法 则 . 最 初 , 我 们 


认为 上 述 公 式 只 能 在 B 的 概率 不 为 零 的 情况 下 成 立 , 但 直接 的 验证 表明 了 当 B 的 
概率 等 于 零 时 它 仍然 成 立 . 如 果 条 件 概 率 和 B 的 概率 都 很 容易 计算 , 那么 利用 一 


©O 
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般 乘 法 法 则 可 以 很 方便 地 求 出 事件 4 和 B 同时 发 9 
Pr(4n B) = Pr(BI4)Pr(4) 也 应 该 成 立 , 稍 后 将 详细 


E 的 概率 . 


当然 , 由 对 称 性 可 知 


Pe 


介 引 


这 


底 
操 ) 
A 


4.2.2 ”扑克 牌 的 例子 


我 们 看 为 一 个 例子 . 仔细 
恰 有 三 条 的 例子 : 假设 你 正在 扩 


观察 , 看 看 这 是 不 是 一 个 解 


决 问题 的 好 方法 . 


扑克 有 牌 , 用 的 是 


副 标准 


牌 . 如 果 你 已 经 拿 到 


了 两 张 J 和 一 张 4 那么 最 终 恰好 拿 到 三 条 的 概率 是 多 少 


们 有 


个 三 条 和 一 个 对 子 , 那么 出 


现 3 次 的 点 数 


? (需要 说 明 的 是 : 如 果 我 


只 有 一 个 ; 出 现 4 次 的 点 数 不 被 计 


算 在 内 . 我 们 考察 的 点 数 必须 恰好 出 现 3 次 : 既 能 不 多 , 也 能 不 少 . ) 


解答 : 


是 “如 果 你 已 经 拿 到 ] ” 


我 们 要 做 的 第 一 件 事 就 是 认识 到 这 是 一 个 条 件 概率 问题 . 关键 的 语句 
只 要 看 到 “如 果 ” 或 者 “已 知 ”, 就 要 意识 到 这 里 


可 能 会 用 到 条 件 概率 . 这 的 确 是 一 个 条 件 概 率 问 题 : 在 给 定 的 初始 条 件 下 , 拿 到 某 


种 特定 牌 型 的 概率 是 多 少 . 我 们 可 以 采用 上 个 例子 的 方法 , 先 求 出 Pr(“ 特 定 牌 型 ” 


开 


“初始 条 件 ”) 和 Pr(“ 初 始 条 件 ”), 然后 再 
中 , 利用 这 种 方法 来 计算 就 是 


场 距 梦 . 这 个 问题 还 有 一 


4 
ED 


下 如 何 得 到 三 条 . 因为 还 有 2 张 牌 没 拿 , 所 以 拿 到 


计算 两 者 的 比值 . 不 垃 的 是 ， 


个 更 好 的 解决 方法 . 现在 
3 张 点 数 相同 的 牌 的 方法 


只 有 又 拿 到 了 一 张 J, 或 者 又 拿 到 了 2 张 4 (因为 只 有 5 


张 牌 , 所 以 不 可 能 同时 拿 


到 3 张 J 和 3 张 4). 我 们 来 考察 每 种 可 能 的 情况 . 现在 还 剩 下 49 张 牌 并 且 点 数 为 
4 的 牌 有 3 张 , 那么 先 拿 到 一 张 4 的 概率 是 3/49; 接着 又 拿 到 第 二 张 4 的 概率 是 


2/48( 已 知 拿 到 了 一 张 4). 因 


或 约 为 0.26%. 


简单 提 一 下 , 注意 我 们 拿 到 2 张 4 的 概率 也 涉及 条 伯 


知 Pr(4nB) = Pr(41B):Pr(B). 因此 , Pr(“ 取 到 的 第 二 张 牌 是 4” 并 | 


此 , 我 们 拿 到 的 牌 中 恰 有 3 张 4 的 概率 是 订 :总 = 总 ， 


概率 . 由 一 般 乘 法 法 则 可 


上 日 “ 取 到 的 第 


一 张 牌 是 4”)= Pr(“ 取 到 的 第 一 张 牌 是 4”). Pr(“ 取 到 的 第 二 张 牌 是 4”|“ 取 到 的 


“已 知 


第 一 张 牌 是 4” )= 209' 48) 
取 到 的 第 一 张 牌 是 4 
是 条 件 概 率 有 广泛 应 用 的 原因 . 


现在 , 我 们 来 考虑 恰好 拿 到 一 张 J 的 情况 . 


3 2 


这 恰好 等 于 前 面 的 结果 . 非常 幸运 , 我 们 能 轻松 地 计算 出 
中 取 到 的 第 二 张 牌 也 是 4” 的 条 件 概率 . 实际 上 , 这 就 


k 剩 下 49 张 牌 :2 张 J 和 47 张 点 


数 不 是 J 的 牌 . 我 们 可 能 先 拿 到 了 一 张 J, 然后 拿 到 一 张 不 是 J 的 牌 , 出 现 这 种 情况 


[I 


的 概率 是 


49 


.区 ;另外 , 我 们 也 可 能 9 
这 种 情况 的 概率 是 务 “ 去 . 


这 


或 约 等 于 8%. 另外 还 要 注意 ， 


果 能 
张 


Wt 


出 这 个 概率 是 错误 的 , 那 很 不 错 ; 
, 因此 这 里 的 分 析 要 有 一 点 变化 . 
现在 我 们 已 经 求 


两 个 概率 是 相等 的 , 它们 的 和 是 2 = 


E 拿 到 了 一 张 不 是 本 的 牌 , 然后 拿 到 一 张 J, 出 现 


2.47 47 


在 1 = 588 ~ 0.08, 


我 们 正在 考察 最 终 拿 到 3 张 J 和 2 张 4 的 情况 . 如 


于 现在 只 有 4 


6 张 可 用 的 牌 (而 不 是 49 


了 拿 到 3 张 4 和 3 张 J 的 概率 , 那么 拿 到 三 条 的 概率 是 多 
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少 ? 因为 只 有 5 张 牌 , 所 以 我 们 不 可 能 同时 取 到 3 张 和 3 张 4; 因此 , 拿 到 三 条 
的 概率 就 是 拿 到 3 张 J 的 概率 加 上 拿 到 3 张 4 的 概率 , 即 
1 47 


率 问 题 , 但 


7 
t = 2 和 
392 588 1176 0 


等 一 下 ! 解决 上 面 这 个 问题 的 方法 似乎 有 些 奇怪 . 虽然 意识 到 了 这 是 个 条 件 概 


我 们 并 没有 使 用 Pr(4|B) = Pr(4n B)/Pr(B)! 发 生 了 什么 呢 ? 不 要 担 


心 , 我 们 把 这 个 问题 看 作 条 件 概率 问题 是 没 错 的 . 这 里 确实 使 用 了 条 件 概率 , 只 是 


形式 不 同 首 
张 牌 的 概率 时 


i 已 . 在 已 知 拿 到 的 第 一 张 牌 是 什么 的 前 提 下 , 当 我 们 讨论 第 二 次 拿 到 某 
}, 就 用 到 了 条 件 概 率 . 虽然 可 以 按照 传统 方式 用 公式 来 求解 , 但 还 可 


以 用 男 一 种 方法 更 加 轻松 地 解决 问题 . 我 们 要 做 的 就 是 利用 给 定 信 息 直 接 求 出 已 知 
B 时 事件 A 的 概率 . 现在 我 们 用 更 “传统 ”的 方法 来 解决 这 个 问题 . 


我 们 要 做 的 第 一 件 事 是 明确 4 和 B 是 什么 . 事件 B 表示 5 张 牌 中 的 前 3 张 
牌 是 2 张 J 和 一 张 4 事件 4 指 的 是 这 5 张 牧 中 恰 有 3 张 J 或 3 张 4. 我 们 先 来 
计算 较 容易 求 的 Pr(B). 取出 5 张 牌 这 件 事 并 不 重要 , 最 后 2 张 牌 可 以 任意 取 . 重 
要 的 是 , 前 3 张 牌 中 有 2 张 J 和 一 张 4. 计算 这 个 概率 的 一 个 好 方法 是 认为 它 等 于 


(MO/( = 6/5525. 为 什么 呢 ? 我 们 必须 从 4 张 工 中 选 出 2 张 , 还 要 从 4 张 4 中 


选 出 一 张 , 然后 


了 除 以 从 52 张 牌 中 选 出 3 张 的 方法 数 . 这 比 研究 取 到 2 张 ] 和 一 


张 4 的 3 种 不 同方 法 要 快 一 些 : JJ4、J4J 和 4JJ. 


到 3 张 


我 们 还 剩 下 


处 理 问题 ! 
在 这 里 , 我 们 学 到 了 一 个 教训 , 那 就 是 有 时 使 用 条 件 概率 公式 更 容易 , 但 有 时 


J 或 3 张 4, 并 且 前 3 张 牌 是 2 张 本 和 一 张 4. 一 种 方法 是 先 选 出 前 3 张 
牌 , 然后 再 看 剩 下 的 2 张 牌 . 但 是 请 注意 , 一 旦 开始 这 样 做 , 我 们 就 会 像 之 前 那样 来 


个 较 难 处 理 的 事件 . 4n 的 概率 该 怎么 算 ? 它 意味 着 我 们 会 拿 


利 


用 给 定 信息 直接 计算 会 更 容易 . 


4.2.3 ”帽子 问题 和 纠 错 码 


我 们 回 过 头 来 看 本 章 前 面 的 这 题 , 即 三 个 人 戴 三 顶 帽 子 的 问题 . 解 题 的 思路 是 : 


每 个 人 仅 在 看 到 两 项 相同 颜色 的 帽子 时 才 开 口 说 话 (你 看 到 条 件 概 率 了 吗 ), 而 且 要 
说 相反 的 颜色 . 为 什么 要 这 样 做 ?帽子 的 颜色 共有 8 种 可 能 的 分 法 : WWW、 WWB、 


WBW.、B 


WW、WBB、BWB、BBW 和 BBB(W 代表 白色 , B 代表 黑色 ). 注意 , 三 


项 帽子 的 颜色 完全 相同 的 情况 只 有 2 种 . 在 这 些 情况 下 , 每 个 人 都 会 说 出 相反 的 颜 
此 时 , 三 个 人 都 说 错 了 . 其 余 6 种 情况 都 有 两 项 相同 颜色 帽子 , 而 第 三 项 帽子 


色 ; 


说 上 


是 另 一 种 颜色 . 在 这 些 情况 下 , 只 有 一 个 人 能 看 到 两 顶 相 同 颜色 的 帽子 . 这 个 人 会 


正确 的 颜色 ， 


日 其 余 两 人 保持 沉默 . 因此 , 我 们 能 猜 对 8 种 情况 中 的 6 种 , 或 


者 说 廉 的 概率 是 75%! 注意 , 每 个 人 都 有 一 半 的 机 会 说 错 ; 我 们 能 做 的 就 是 列 出 错 
误 的 结果 (所 以 当 我 们 说 错时 , 我 们 就 真 的 错 了 ! ), 表 4-2 阐明 了 这 一 点 . 
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表 4-2 对 这 8 种 情况 的 分 析 


结果 第 一 个 人 说 ”第 二 个 人 说 ”第 三 个 人 说 ”第 一 个 人 第 二 个 人 第 三 个 人 结果 
WWW B B B x x x 失败 
WWB B VvV 成 功 
WBW B 这 成 功 
BWW B yh 成 功 
WBB WwW 4 成 功 
BWB Ww VvV 成 功 
BBW WwW 成 功 
BBB W W W x x x 失败 
这 不 仅仅 是 条 件 概率 的 一 个 简单 的 例子 , 在 纠 错 码 的 生成 中 也 起 着 关键 的 作 


用 . (这 是 一 种 传输 信息 的 方法 . 接收 方 不 仅 能 够 检测 
信息 的 情况 下 对 它 进行 修复 ! ) 要 了 解 更 多 信息 


明码 ). 
4.2.4 ”高 等 注解 : 条 件 概 率 的 定义 
最 后 , 我 们 给 出 一 个 高 等 注解 .如果 


它 与 本 书 的 其 他 部 分 无 关 为 什么 条 件 概 率 被 简单 地 “定义 ”为 Pr(4|B) = Pr(An 
B)/Pr(B)? 这 个 定义 能 否 从 前 面 的 概率 公理 中 推导 出 来 ? 是 可 以 
多 给 出 一 些 假设 , 现在 就 来 做 这 件 事 . 假设 我 们 


出 错误 , 还 可 以 在 不 需要 额外 
县 , 请 参阅 [CM]( 或 上 网 查找 (3,1) 汉 


不 感 兴趣 , 你 可 以 放心 地 跳 过 本 节 , 因为 


的 , 但 我 们 需要 再 


考察 的 概率 空间 是 (9, 5Y, P), 但 事 


件 互 的 发 生 使 得 概率 分 布 变 成 了 _Pp. 那么 现在 事件 4 发 生 的 概率 是 多 少 ? 我 们 
需要 做 两 个 俱 设 ; 首先 , 因为 B 已 经 发 生 , 所 以 Pp(4) = 0 对 所 有 的 4 c B* 均 成 


立 ; 其 次 , 我 们 不 希望 概率 的 相对 大 小 发 和 


是 不 相交 的 ， 那么 


E 变 化 . 也 就 是 说 , 如 果 4,C CQ 与 不 


注意 , 由 此 可 知 , 存在 某 个 常数 a, 使 得 PP(4) = 
一 点 , 我 们 选择 一 些 特殊 的 集合 . 最 常见 的 两 种 做 法 是 让 C = B, 或 者 让 4 = B. 因 
时 , 有 Pp(C) = 1( 这 
是 因为 C = B, 而 且 当 已 知 B 发 生 时 B 的 概率 是 1! ) 和 P(CNB)== P(B)( 因 为 
此 时 Cnm 就 是 B). 我 们 看 到 Pp(4) 等 于 P(A4N B)/P(B). 


为 要 把 4 看 作 一 般 集合 ， 所 以 我 们 尝试 第 


一 种 做 法 . 当 


P(AIB) = aP(4NB). 为 了 看 出 这 


C=B 


因此 , a = P(B). 


我 们 举 个 例子 . 事件 4。 表 示 独 立地 抛掷 两 颗 均 匀 的 骨 子 , 它们 的 和 等 于 s. 事 


件 B 表示 第 二 颗 蜗 子 的 点 数 是 3. 我 们 来 计算 Pp(A 

前 提 下 , 两 颗 山 子 之 和 是 s 的 概率 . 由 于 第 1 颗 山 子 的 点 数 可 能 
和 9 之 间 取 值 . 
时 ,，Pp(4。) = 0, 所 以 我 们 要 把 注意 力 集中 在 4< s< 9 上 . 


的 任何 一 个 , 因此 两 颗 肯 子 之 和 必须 在 4 


s), 即 已 知 第 二 颗 嚼 子 是 3 的 


是 {1,2,.… ,6} 中 


于 是 , 当 s<3 或 s>10 
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| 


首先 注意 到 , 由 于 掷 吕 
时 , P(4。mn) 是 多 少 呢 ? 对 于 每 一 个 s, 为 了 保证 第 一 颗 山 子 


| 


本 
口 


s, 第 一 颗 骨 子 有 | 
只 包含 其 中 的 一 对 . 人 多 
因此 , 对 于 每 一 个 s, 均 有 P(4。m B) = 1/36. 才 


量具 有 一 利 


可 能 的 取 值 . 因此 , 在 36 对 可 
如, 44 包含 的 结果 是 (1,3), 45 包含 的 结果 是 (2,3), 等 等 . 
巴 这 些 结果 组 合 在 一 起 , 由 上 面 的 公 


个 3 的 概率 是 1/6, 所 以 P(B) = 1/6. 当 4<s<9 


的 点 数 加 上 3 之 后 等 
能 的 结果 中 , 每 个 4。 


式 可 得 : 当 4 < s < 9 时 , 条 件 概率 Pp(4。) = P(4。|B) 就 是 PL4。mn B)/P(B) = 
(1/36)/(1/6) = 1/6; 否则 为 0. 


概率 论 中 最 重要 


4 


通过 快速 检验 , 我 们 可 以 看 出 这 个 结果 是 非常 合理 的 . 已 知 B 发 生 的 前 提 下 ， 
两 颖 骨 子 之 和 不 可 能 小 于 


或 大 于 9, 而 剩 下 的 6 种 可 能 情况 应 该 是 等 可 能 的 , 这 
恰 与 上 面 的 结果 相 吻 合 . 注意 , 已 知 B 时 4。 的 条 件 概率 与 4。 的 概率 是 完全 不 同 
的 , 这 是 因为 P(A4s) = P(Ai2) = 1/36, P(As) = P(A11) = 2/36,:…, P(A;) = 1/6. 


4.3 独 


立 性 


那么 就 说 它们 是 相互 独立 的 . 这 意味 着 , 从 某 个 事件 发 生 无 法 


的 概念 之 一 是 独立 性 .通俗 地 说 , 如 果 两 个 事件 不 相互 影响 ， 


E 出 另 一 个 事件 发 生 


的 可 能 性 . 我 们 已 经 在 前 儿 页 中 给 出 了 粗略 的 定义 . 例如 , 当 你 抛 撕 一 枚 硬币 时 , 它 


正面 朝 上 的 概率 不 应 该 受到 上 一 次 结果 的 影响 . 


因此 , 除非 发 生 了 一 些 奇怪 的 事情 ， 


我 们 可 以 认为 连续 抛 括 便 币 是 相互 独立 的 事件 . 虽然 独立 性 看 起 来 是 个 相当 直观 的 


外 的 假设 . 


概念 , 但 有 时 也 会 让 你 感到 非常 国手 . 因此 


条 件 概率 就 可 以 给 出 一 个 这 样 的 定义 . 请 尘 


因为 它 巧妙 地 假设 了 一 个 不 必要 的 额外 事实 . 在 继续 


, 我 们 需要 一 个 清晰 明确 的 定义 , 而 利用 
FE 意 下 面 的 定义 是 “暂时 ”的 . 这 样 做 是 
下 读 之 前 , 看 你 能 否 找 出 意 


独立 性 的 暂时 定义 : 考虑 事 伯 


FE 4 和 B. 如 果 


Pr(A|B) = Pr(4)， 


那么 我 们 暂时 说 4 和 B 是 相互 独立 的 . 也 就 是 说 , 如 果 事 件 
事件 4 发 生 的 概率 , 那么 4 和 B 就 是 相互 独立 的 . 


B 的 发 生 不 会 改变 


如 有 果 认 真 思考 一 下 这 个 定义 , 我 们 就 会 意识 到 它 给 出 了 独立 性 的 核心 内 容 . 如 


果 Pr(4|B) = Pr(A4), 那么 


硬币 的 例子 


正如 你 想象 的 那 
了 一 般 乘法 法 则 : 


研究 独立 事件 是 


这 并 没有 告诉 我 们 


ln 


牛 非常 美妙 的 事 . 在 


Pr(ANMB)= Pr(A|B).: Pr(B). 


事件 B 的 发 生得 不 到 有 关 事 件 4 的 任何 信息 . 在 抛 丘 
,虽然 上 一 次 括 出 了 正面 , 1 


下 一 次 会 括 出 正面 的 


E 4.2 节 中 , 我 们 给 出 
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一 、 


旦 是 , 现在 假设 4 和 B 是 相互 独立 的 事件 . 这 意味 着 Pr(4|B) = Pr(4), 于 是 


Pr(AN B) = Pr(A). Pr(B). (4.4) 


这 是 个 非常 好 的 结果 , 我 们 可 以 求 出 两 个 事件 同时 发 生 的 概率 , 而 不 必 计 算 条件 概 
率 . 在 接 下 来 的 几 音 中 , 当 开 始 讨论 随机 变量 时 , 我 们 会 看 到 更 多 独立 性 的 例子 . 
为 什么 称 上 述 定义 是 独立 性 的 “暂时 ”定义 ? 记得 我 们 求 已 知 B 时 4 的 条 件 


概率 时 , 要 求 B 的 概率 不 为 0. 因此 , 如 果 B 不 发 生 , 那么 我 们 就 无 法 讨论 独立 性 . 


此 外 , 这 里 还 应 该 有 对 称 性 ! 如 果 4 和 B 是 相互 独立 的 , 那么 B 和 4 也 是 相互 独 


立 的 , 我 们 的 定义 应 该 反映 出 这 一 点 . 


此 , 两 个 事件 独立 性 的 正确 定义 是 


可 以 看 到 , 原来 的 定义 是 不 完善 的 . 幸运 的 是 , 我 们 已 经 在 式 (4.4) 中 看 到 了 解 
决 方案 . 注意 这 里 的 对 称 怕 因 


E; 另外 , 当 所 有 概率 都 为 0 时 , 这 个 等 式 是 有 意义 的 . 


独立 性 (两 个 事件 ): 如 果 事 件 4 和 B 满足 


那么 4 和 B 就 是 独立 的 . 


Pr(ANMB)= Pr(A).:Pr(B), 


三 个 或 更 多 个 事件 的 独立 性 该 如 何 定义 ? 我 们 对 两 个 事件 独立 性 的 定义 可 以 
扩展 到 三 个 或 更 多 的 事件 上 . 


独立 性 (三 个 事件 ): 如 果 事 件 4, B 和 C 满足 
(1) Pr(ANBNMOC)= Pr(A):Pr(B):Pr(O), 并 


(2) 其 中 任意 两 个 事件 都 是 独立 的 ， 
那么 A、B 和 C 就 是 相互 独立 的 . 


注意 , 第 二 个 条 件 意味 着 Pr(4n B) = Pr(4) .Pr(B), 并 且 对 Pr(4mC) 和 
Pr(BnC) 也 有 同样 的 结果 . 如 果 有 7 个 独立 的 事件 , 那么 其 中 任意 多 个 事件 也 应 


该 是 独立 的 . 这 似乎 是 合理 的 , 是 条 件 (2) 所 描述 的 内 容 . 另外 , 还 应 该 有 一 些 关 于 


所 有 事件 的 陈述 , 也 就 是 条 件 (1). 更 一 般 的 情况 是 , 对 于 个 事件 41,… , 4%, 如 
果 类 似 的 公式 适用 于 这 些 事件 的 任意 组 合 , 那么 就 称 A1,… , A 是 独立 的 . 


(1) Pr(Ai1 NN A,) 


独立 性 (一 般 情形 ): 如 果 


(2) {41,… ,4A%} 的 任意 一 个 非 空 子 集 都 是 相互 独立 的 ， 
那么 41,… , An, 就 是 相互 独立 的 . 


事件 41,… , An 满足 
二 Pr(A1)…Pr(4%), 并 且 


关于 三 个 或 更 多 个 事件 的 独立 性 , 这 里 有 个 重要 的 警告 : 当 任意 两 个 事件 都 独 


立时 , 三 个 或 更 多 事件 可 能 会 相互 依赖 . 例如 , 抛 括 一 枚 般 子 两 次 . 设 


Rs 
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这 是 


。 4 表示 第 一 次 掷 出 了 一 个 偶数 ， 


。B 表示 第 二 次 掷 


上 了 一 个 偶数 ， 


。C 表示 两 次 掷 山 子 的 点 数 之 和 是 个 偶数 ， 


我 们 有 


但 是 ， 


Pr 
Pr 
Pr 


(AN B) = Pr(A) .Pr(B) 
(ANC) = Pr(A) .Pr(C) 
(BNC) = Pr(B) .Pr(C) 


Pr(ANMBNMC)AKPr(A): Pr(B) .Pr(O), 


因为 Pr(A4NBNMO) 


日 和 后 


征 和 外 


一 次 和 第 二 次 都 掷 
都 是 偶数 , 那么 它们 的 和 一 定 是 偶数 , 这 就 是 


Pr(4NnBNMCOC)=3; 但 如 果 这 三 个 事件 是 独立 的 


Pr(ANBNMC)= Pr(A).: Pr(B).:Pr(C) = 


这 里 有 什么 问题 ? 问 


题 是 ， 


B 发 生 时 , C 就 必然 会 发 生 .“ 必 然 ” 这 个 词 体现 


事 “ 必 然 ” 发 生 , 那么 我 们 就 得 到 了 它们 之 间 的 信息 ! 
为 了 好 玩 , 试 着 找 出 一 组 事件 4, B,C,D, 使 得 划 
立 的 , 但 全 部 四 个 事件 不 相互 独立 ! 另外 , 找 出 三 个 事件 4、B 和 C， 
C) = Pr(4)Pr(B)Pr(O), 但 它们 不 独立 . 
具有 统计 学 经 验 的 学 生 请 注意 : 独立 性 


BN 


方面 经 验 的 学 生来 说 , 这 部 分 内 容 可 能 被 称 为 相关 思 台 


P= 内 
学 月 


个 变量 之 间 的 相关 性 | 
相关 系数 是 0, 就 称 它们 是 不 相关 的 . 独立 物 
的 是 要 注意 它们 是 无 法 互 换 的 . 
两 个 不 相关 的 变量 3 


后 


的 人 来 说 , 如 果 随 机 变量 对 和 Y 
了 相关 系数 来 表示 , 其 


出 了 三 个 事件 的 依 


个 


了 偶数 的 概率 (如 果 两 次 的 点 数 


8 现 问题 的 原因 ). 于 是 , 我 们 一 定 有 
, 那么 由 公式 可 得 
111 1 
222 8 


尽管 这 三 个 事件 中 的 任意 两 个 是 相互 独立 的 , 但 当 4 和 


赖 关系 . 如 果 某 


中 任意 三 


-7 一 一 


具有 线 怕 


FE 关 系 , 那么 就 称 它 


值 介 于 -1 和 1 之 间 . 如 果 X 和 
E 和 不 相关 这 两 个 概念 很 相似 , 但 重要 


随机 变量 的 独 


不 一 定 是 独立 的 . 这 里 


求 夫 


系 的 两 个 变量 可 以 是 不 相关 的 , 但 


立 性 可 以 推出 它们 


只 有 单 癌 的 强 含 关系 是 


事件 都 是 相互 独 


使 得 Pr(4 nn 


的 概念 在 统计 学 中 非常 重要 . 对 于 有 这 
全 的 概念 . 对 于 那些 没有 统计 


门 是 相关 的 . 两 


Y 的 


是 不 相关 的 , 但 
内 为, 独立 性 要 


个 变量 完全 不 相关 , 但 两 个 变量 只 要 没有 线性 关系 就 是 不 相关 的 . 具有 平方 关 


ED 


4.4 


不 可 能 是 独立 的 . 


贝 叶 斯 定理 


此 时 , 如 果 你 想 了 解 一 般 乘 法 规则 的 某 个 特性 , 那么 
的 选择 . 这 个 法 则 告诉 我 们 


口 


过 头 来 看 一 下 似乎 是 个 
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Pr(ANMB)= Pr(A|B) .Pr(B). 
把 它 翻转 一 下 ! 根据 BN 4 = An B, 是 不 是 也 得 到 了 
Pr(AN B) = Pr(B|A) .Pr(A)? 
我 们 可 以 这 样 做 吗 ? 的 确 可 以 ! 记 住 4nB 和 BN 4 是 同一 个 事件 , 它们 都 表示 4 
和 B 同时 发 生 . 因此 , 我 们 一 定 有 Pr(4n B) = Pr(Bn A4). 由 此 可 以 推出 下 面 的 结 
论 , 即 贝 叶 斯 定理 . 
贝 叶 斯 定理 : 由 一 般 乘 法 法 则 可 以 推出 : 对 于 事件 4 和 B, 有 
Pr(B|A): Pr(A) = Pr(A|B). Pr(B). 
因此 , 只 要 Pr(B) 承 0, 我 们 就 有 


Pr(A) 
Pr(B) 


Pr(A|IB) = Pr(BI4) 


上 述 内 容 的 关键 思路 是 可 交换 性 : A Nn B = BNA. 我 们 会 不 断 地 看 到 由 可 交 
换 性 推出 的 结论 , 其 中 一 个 很 好 的 结论 涉及 卷 积 以 及 独立 随机 变量 之 和 的 条 母 函数 
(参阅 19.5 节 中 关于 卷 积 交换 性 的 证 明 ). 

在 4.6 节 中 , 我 们 会 探讨 贝 叶 斯 定理 的 一 般 版 本 . 虽然 这 是 一 个 非常 有 用 的 结 
果 , 但 很 多 学 生 在 初次 使 用 它 时 都 会 遇 到 麻烦 . 我 认为 它 是 概率 论 入 门 课 中 混乱 的 
重要 来 源 (其 他 重要 来 源 是 第 3 章 中 的 离散 组 合 问题 , 所 以 请 打 起 精神 , 我 们 首先 
要 讲 的 是 最 糟糕 的 内 容 ). 

为 了 帮助 理解 , 我 们 也 会 使 用 期 望 计 数 法 来 解决 这 些 问题 . 贝 叶 斯 定理 在 许多 
场合 中 得 到 了 使 用 、 误 用 和 争论 . 我 最 喜欢 在 法 庭 上 旁听 对 贝 叶 斯 定理 的 讨论 . 没 
错 , 就 是 法 庭 ! 仔细 想 一 下 这 个 问题 , 你 就 不 会 觉得 不 合理 了 . 检 方 正在 试图 证 明 ， 
鉴于 所 有 这 些 信息 , 被 告 有 徘 的 可 能 性 非常 高 (用 他 们 的 行 话 来 说 , 这 种 高 概率 “ 超 
出 了 合理 的 怀疑 ”). 与 此 同时 , 辨 方正 在 试图 反 驶 . 这 一 切 都 可 以 归结 为 计算 给 定 
信息 的 概率 . 所 以 , 就 像 概 率 论 课 和 作业 起 初 看 起 来 似乎 很 难 , 而 且 你 很 担心 你 的 
生活 取决 于 一 个 好 成 绩 那样 , 请 放心 , 事实 并 非 如 此 ! 有 一 个 在 法 庭 上 使 用 贝 叶 斯 
定理 的 故事 , 见 《 卫 报 》 文 章 4 Formula for Justice. 遗憾 的 是 , 法 官 裁定 贝 叶 斯 定 
时 不 能 再 使 用 . 在 众多 帖子 中 , 我 最 喜欢 的 一 个 来 自 于 pseudospln( 发 表 于 2011 年 
10 月 3 日 12:03 am):“ 难 道 你 不 应 该 被 陪审 团 审判 吗 ? 如 果 我 正在 受审 , 而 陪审 团 
无 法 理解 贝 叶 斯 定理 , 那么 我 认为 他 们 没有 资格 辩护 , 他 们 的 判决 当然 也 不 适用 于 

现在 我 们 来 考察 一 个 典型 的 贝 叶 斯 问题 . 这 个 问题 很 无 聊 , 也 许 看 起 来 并 不 习 
么 重要 . 这 些 评价 确实 是 有 道理 的 , 但 是 由 于 这 类 问题 在 课程 中 很 常见 , 所 以 我 们 


YH 


OO 
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有 必要 看 一 个 例子 . 作为 奖励 , 之 后 我 们 会 讨论 一 个 具有 大 量 应 用 的 突出 问题 ! 

例子 : 假设 有 40% 的 成 年 人 养 狗 , 而 每 年 有 20% 的 养 狗 人 会 得 流感 . 如 果 每 
年 有 15% 的 成 年 人 会 得 流感 , 那么 已 经 得 流感 的 某 个 人 养 狗 的 概率 是 多 少 ? 

解答 : 我 们 用 D 来 表示 养 狗 这 件 事 , 用 玉 来 表示 得 流感 这 件 事 , 虽然 也 可 以 
分 别 用 4 和 B 来 表示 , 但 这 里 的 符号 更 具有 启发 性 . 我 们 希望 求 出 已 经 得 流感 的 
某 个 人 养 狗 的 概率 用 数学 语言 来 说 , 即 Pr(D|F). 我 们 知道 某 人 养 狗 的 概率 
是 0.4, 即 Pr(D) = 0.4, 某 人 得 流感 的 概率 是 0.15, 即 Pr(P) = 0.15. 最 后 , 我 们 还 
知道 每 年 有 20% 的 养 狗 人 会 得 流感 , 所 以 Pr(FID) = 0.2. 因此 , 由 贝 叶 斯 定理 可 
知 


Pr(D 0.4 
Pr(D|F) = Pr(F|ID). BE =02. 0s ~ 0.53. 
如 果 你 无 法 理解 为 什么 由 贝 叶 斯 定理 可 以 推出 概率 0.53, 那么 可 以 利用 期 望 计 
数 法 来 解决 这 个 问题 , 如 表 4-3 所 示 . 假设 一 共有 100 个 人 . (我 们 之 所 以 选择 100， 
是 因为 它 能 确保 我 们 在 解决 问题 时 得 到 的 人 数 是 整数 . 你 可 以 选择 想 要 的 任何 数 .) 
我 们 预计 有 40 个 人 养 狗 , 而 这 40 个 人 中 有 8 人 得 流感 . 由 于 每 年 有 15% 的 人 得 
流感 , 所 以 预计 会 有 15 个 人 生病 . 因此 , 在 15 个 生病 的 人 中 , 有 8 个 人 养 狗 . 于 
是 , 已 经 得 流感 的 某 个 人 养 狗 的 概率 是 8/15 s 0.53. 在 不 明确 使 用 贝 叶 斯 公式 的 情 
况 下 , 期 望 计数 法 是 解决 这 类 问题 的 一 种 好 方法 . 


表 4-3 在 100 个 人 中 , 养 狗 人 和 流感 病例 的 预期 详情 . 由 于 15 个 生病 的 人 中 有 8 个 
人 养 狗 , 所 以 已 经 得 流感 的 某 个 人 养 狗 的 概率 是 8/15 守 0.53 


养 狗 的 人 8 32 40 
没 养 狗 的 人 7 53 60 
总 数 15 85 100 


现在 继续 讨论 已 承诺 的 重要 问题 . 在 下 面 的 讨论 中 , 需要 引入 划分 的 概念 . 在 
这 里 我 们 只 简要 地 介绍 一 下 , 之 后 会 在 4.5 节 中 对 划分 展开 详细 讨论 . 

例子 : 在 全 国 范围 内 , 每 15 000 个 人 中 就 有 一 个 人 感染 结核 病 . 假设 你 所 在 的 
城镇 出 现 了 一 次 结核 病 恐 慌 ; 为 了 简单 起 见 , 不 妨 设 该 城镇 的 结核 病 发 病 率 与 全 国 
平均 水 平 相同 . 为 了 安全 起 见 , 你 去 医院 检查 是 否 感染 了 这 种 疾病 . 医生 告诉 你 , 这 
个 测试 出 现 假 阳 性 的 概率 是 1%, 也 就 是 说 , 每 100 个 健康 人 中 会 有 一 个 人 的 测试 
显示 为 阳性 . 医生 还 透露 , 这 个 测试 的 假 阴 性 率 为 0.1%, 即 每 1000 个 得 病 的 人 中 
只 有 一 个 人 的 检测 会 显示 为 阴性 . 假设 你 的 检测 为 阳性 , 那么 感染 结核 病 的 概率 是 
多 少 ? 

解答 : 在 阅读 解决 方案 之 前 , 先 猜 一 下 这 个 概率 . 很 多 人 猜测 这 个 概率 会 很 高 ， 
经 常 出 现在 90% 以 上 的 范围 内 . 毕竟 , 测试 是 阳性 的 ! 然而 , 事实 证 明 这 个 概率 是 


4.4 贝 叶 斯 定理 ”151 


相当 小 的 . 这 是 个 很 棒 的 问题 , 因为 它 演示 了 非 直观 的 概率 推理 是 如 何 展开 的 . 
我 们 将 再 次 用 到 条 件 概率 . 现在 , 我 们 知道 Pr( 阳 性 | 健康 ) 和 Pr( 阴 性 | 得 病 )， 
希望 求 出 Pr( 得 病 | 阳性 ). 注意 , 我 们 再 次 使 用 了 恰当 的 描述 性 标签 来 表示 事件 ; 
我 完全 鼓励 你 这 么 做 . 这 些 问 题 已 经 够 复杂 了 , 花 点 时 间 来 选择 合适 的 符号 可 以 很 
轻松 地 阅读 , 看 出 每 一 项 都 代表 了 什么 . 
根据 贝 叶 斯 定理 , 我 们 知道 
但 ， HE Pr( 得 病 ) .Pr | 2 
Pr( 得 病 | 阳性 ) = Px( 卫 性 ) Pr( 阳 性 | 得 病 ). 
如 果 我 们 知道 得 病 的 概率 是 1/15 000, 而 病人 的 检测 结果 为 阳性 的 概率 是 0.999， 
那么 得 到 阳性 结果 的 概率 是 多 少 ? 很 重要 的 一 点 是 , 要 意识 到 这 里 没有 直接 给 出 这 
个 信息 , 需要 利用 给 定 的 信息 求 出 Pr( 阳 性 ). 
我 们 可 以 利用 来 求 出 这 个 概率 . 4.5 节 会 更 详细 地 讨论 划分 , 这 里 只 需要 划分 
成 两 种 可 能 情况 (这 两 种 情况 是 “得 病 ” 和 “ 没 得 病 ”). 
划分 把 事件 分 割 成 了 互 不 相交 的 事件 . 设 4 和 B 是 两 个 事件 , 那么 
A=(ANMNB)U(ANB'), 
我 们 把 4 写成 了 两 个 互 不 相交 的 事件 的 并 . 由 概率 公理 可 知 ， 
Pr(A) = Pr(ANMB)+Pr(ANB'). 
我 们 还 可 以 进一步 简化 . 利用 条 件 概率 , 我 们 得 到 
Ppr(AN B) = Pr(AIB)Pr(B) 和 Pr(AN Bo = Pr(A|B°)Pr(B’). 
这 就 是 称 之 为 划分 的 原因 . 我 们 把 4 发 生 的 概率 分 成 了 两 部 分 , 一 部 分 涉及 B 发 
生 , 男 一 部 分 涉及 Be 发 生 . 因为 已 和 Be 不 可 能 同时 发 生 , 所 以 我 们 把 概率 划分 
成 了 两 种 互 不 相交 的 情况 . 
我 们 使 用 “得 病 ” 和 “ 没 得 病 ” 这 个 划分 . B 就 表示 得 病 的 事件 , B° 表示 健康 
( 即 “ 没 得 病 ”) 的 事件 , 而 4 就 是 测试 显示 为 阳性 这 一 事件 . 我 们 有 
Pr( 阳 性 ) = Pr( 阳 性 | 得 病 )Pr( 得 病 ) + Pr( 阳 性 | 健康 )Pr( 健 康 ) 
14 999 _ 
15000 


一 0.999. I 十 0.01 0.01. 


15 000 


这 给 出 了 1/15 000 
[得病 | 阳性 ) = . 7 * 0.999 ~ 0.0066. 


P 

你 有 没有 想到 概率 会 这 么 低 ? 
我 们 试 着 在 这 里 使 用 可 靠 的 期 望 计数 法 . 假设 有 1500 万 人 . (同样 地 , 1500 万 
这 个 数 只 是 为 了 方便 我 们 得 到 整数 多 个 人 . 它 源 自 于 问题 中 的 15 000, 通过 在 末尾 


叫 
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补充 几 个 0 来 确保 所 有 的 派生 量 都 是 整数 . ) 那么 我 们 预计 其 中 有 1000 人 被 感染 
(让 感染 率 1/15 000 乘 上 1500 万 倍 ), 而 其 余人 不 会 被 感染 . 在 被 感染 的 人 群 中 , 预 
计 有 999 个 人 的 检测 会 显示 阳性 , 而 在 14 999 000 个 没有 被 感染 的 人 中 , 预计 有 
149 990 个 人 的 检测 会 显示 阳性 . 因此 , 一 共有 149 990 + 999 = 150 989 个 人 的 检 
测 是 阳性 , 而 其 中 真正 得 病 的 只 有 999 个 人 . 所 以 , 当 你 的 检测 为 阳性 时 , 真正 得 病 
的 概率 为 999/(149 990 + 999) 3 0.0066. 从 直观 上 看 , 结果 如 此 之 低 的 原因 是 疾病 
最 初 的 发 病 率 太 小 . 

在 如 图 4-3 所 示 的 树 形 图 中 , 我 们 可 以 看 到 更 加 形象 的 期 望 计数 法 . 


14 848 010 
人 检测 阴性 


149 990 人 未 感染 
XX 149 000 
人 检测 阳性 


15 000 000 总 人 数 


人 检测 阴性 


> 


检测 阳性 


1000 人 感染 


图 4-3 


你 也 可 以 从 另 一 种 角度 来 解释 检测 结果 . 在 知道 检测 结果 之 前 , 你 预计 自己 得 
结核 病 的 概率 大 约 是 1/15 000. 在 得 到 了 阳性 的 结果 后 , 你 现在 得 病 的 概率 就 变 成 
了 1/150, 或 者 说 得 病 的 概率 增加 了 100 倍 . 

另外 , 如 果 出 现 假 阳 性 的 概率 是 50%, 那么 得 结核 病 概率 是 多 少 ? 由 贝 叶 斯 定 
里 可 知 


Pr( 阳 性 ) = Pr( 阳 性 | 得 病 )Pr( 得 病 ) + Pr( 阳 性 | 健康 )Pr( 健 康 ) 


1 14 999 
二 0.999. -一 十 0.50. ~ 0.50. 
15 000 一 15 000 
现在 , 我 们 有 
1/15 000 


Pr( 得 病 | 阳性 ) . 0.999 ~ 0.000 13. 


0.50 
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这 个 结果 比 假 阳性 率 为 0.01 时 的 结果 小 49/50. 


我 们 有 必要 单独 讨论 一 下 划分 . 划 


分 适用 于 各 类 问题, 将 在 下 节 展 开 讨论 


划分 成 两 部 分 : 设 B 是 满足 0 < Pr(B 
不 发 生 , 也 是 如 此 )， 于 是 , 我 们 可 以 将 
ANB 和 ANnBe, 而 且 有 


Pr(A) = Pr(A|B)Pr(B) + Pr(A|B°)Pr(B®). 
这 个 公式 是 很 合理 的 . 通过 大 声明 读 这 个 式 子 , 我 们 看 到 , 4 发 生 的 概率 就 是 (已 
知 B 发 生 时 4 发 生 的 概率 ) 乘 以 (B 发 生 的 概率 ), 然后 再 加 上 (已 知 B 不 发 生 
时 4 发 生 的 概率 ) 乘 以 (B 不 发 生 的 概率 ). 我 们 分 成 了 两 种 情况 : B 发 生 时 的 


结果 , 和 B 不 发 生 时 的 结果 . 


) < 1 的 事件 (那么 对 于 事件 B*, 即 B 
事件 4 划分 成 两 个 互 不 相交 的 事件 , 即 


例子 : 有 两 个 装着 红 球 和 蓝 球 的 饶 子 .在 第 一 个 镀 子 中 , 红 球 的 比例 是 40%; O 
在 第 二 个 久子 中 , 红 球 的 比例 是 20%. 你 的 朋友 随机 地 从 一 个 缸 子 中 取出 了 一 个 红 


球 . 那么 , 这 个 红 球 取 自 第 一 个 铅 子 的 


距 率 为 多 少 ? 


解答 : 我 们 要 计算 的 是 Pr( 从 第 一 个 镀 子 中 取 球 | 取 到 红 球 )， 利 用 贝 叶 斯 定 


理 , 这 个 事件 发 生 的 概率 是 
Pr( 第 一 个 合子 | 红 球 ) = 0 Pr( 红 球 | 第 一 个 负 了 ) 


知 从 第 一 个 饶 子 中 取 球 的 前 提 下 , 取出 


办 为 是 随机 从 鱼子 里 抽取 , 所 以 从 第 一 个 色 子 中 取 球 的 概率 为 0.5. 为 外 , 在 已 


了 一 个 红 球 的 概率 是 0.4. 那么 取 到 红 球 的 


概率 为 多 少 ? 因为 事件 A( 从 第 一 个 饶 子 中 取 球 ) 和 事件 B( 从 第 二 个 镀 子 中 取 球 ) 


构成 了 一 个 划分 , 所 以 


Pr( 红 球 ) = Pr(4) : Pr( 红 球 |4) +Pr(B). Pr( 红 球 |B) 
=0.5:0.4+0.5.0.2= 0.3. 


于 是 , 在 已 知 取 到 了 红 球 的 前 提 下 , 该 球 取 自 第 一 个 饮 子 的 概率 显然 是 0.5.0.4/0.3 = 


0.67. 


尔 能 理解 上 面 的 论述 吗 ? 为 了 给 出 
论证 . 想象 一 下 , 你 的 朋友 重复 抽取 了 
预计 他 从 第 一 个 饶 子 中 抽取 了 500 次 ， 
同样 , 我 们 预计 他 从 第 二 个 负 子 中 抽取 


更 直观 的 解释 , 我 们 重新 利用 期 望 计数 法 来 
1000 次 , 每 次 都 会 把 球 放 回 去 . 那么 , 我 们 
其 中 有 200 次 (500 乘 以 40%) 取 到 了 红 球 . 
了 500 次 , 而 且 有 100 次 取 到 了 红 球 . 所 以 ， 


在 取 到 红 球 的 300 次 中 , 有 200 次 取 自 第 一 个 镀 子 . 这 意味 着 当 已 知 取 到 红 球 时 ， 


该 球 取 自 第 一 个 铅 子 的 概率 就 是 200/3 


00 ~ 0.67. 
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4.5 ”划分 和 全 概率 法 则 


上 一 节 讨 论 了 贝 叶 斯 定理 , 它 是 个 非常 重要 的 结果 , 允许 我 们 在 两 个 相关 的 条 
件 概 率 之 间 进 行 转换 , 即 Pr(4|B) 和 Pr(B|4). 你 也 可 以 把 它 看 成 交换 积分 次 序 ， 
或 交换 求 和 与 求 导 次 序 的 过 程 . 我 们 经 常 改变 运算 次 序 . 不 过 在 需要 考虑 次 序 的 前 
提 下 , 这 种 做 法 就 行 不 通 了 . 一 般 来 说 ,和 的 平方 根 不 等 于 平方 根 的 和 . 这 里 也 是 
如 此 , 因为 Pr(4|B) = Pr(B|4) 是 非常 罕见 的 , 但 是 事情 并 没有 那么 糟 . 我 们 并 不 
关心 这 两 个 概率 是 否 相 等 , 只 希望 当 给 定 其 中 之 一 时 能 容易 地 求 出 男 一 个 . 为 什么 
呢 ? 通常 情况 下 , 这 两 个 表达 式 中 的 一 个 会 比较 容易 计算 , 这 样 就 给 出 了 求 男 一 个 
表达 式 的 方法 . 

遗憾 的 是 , 贝 叶 斯 定理 很 难 应 用 于 实际 情况 .我 们 需要 明确 地 知道 Pr(4) 和 
Pr(B) 是 多 少 . 通常 ,虽然 无 法 确切 地 知道 Pr(B) 和 Pr(4) 都 是 什么 , 但 我 们 会 得 
到 一 些 条 件 概率 , 由 此 可 以 计算 出 Pr(B) 或 Pr(4). 利用 这 种 方法 , 我 们 可 以 构造 
一 般 版 本 的 贝 叶 斯 定理 . 但 是 , 为 了 做 到 这 一 点 , 必须 先 提高 对 划分 理论 的 认识 . 

在 开始 之 前 , 我 们 先 了 解 一 些 术语 . 记 住 , 如 果 集 合 4 和 集合 B 满足 ANB = Z， 
那么 它们 就 是 不 相交 的 . 也 就 是 说 , 如 果 4 和 没有 相同 的 元 素 , 那么 它们 就 不 
相交 . 


样本 空间 5 的 一 个 划分 就 是 满足 下 列 条 件 的 可 数 个 集合 {41, 4A2,…}. 
(1) 如 果 i 取 j 那么 4 和 4; 不 相交 . 我 们 通常 用 4 nA; = &g 来 表示 这 
两 个 集合 的 交 是 空 集 . 


(2) 全 体 4; 的 并 就 是 整个 样本 空间 : U 4; = 5. 


从 本 质 上 看 , 划分 就 是 一 簇 集合 . 在 这 艇 集合 中 , 每 种 可 能 的 结果 都 恰好 出 现 
一 次 . 我 们 已 经 看 到 过 好 几 次 划分 了 , 比如 样本 空间 被 划分 成 了 B 和 非 B( 或 者 说 
B 和 Be). 这 里 只 是 给 出 了 更 一 般 的 情况 . 
O 举 个 例子 , 假设 我 们 正在 研究 抛掷 一 枚 6 面 角 子 的 可 能 结果 . 此 时 样本 空间 是 
5 = {1,2,3,4,5,6}. 接 下 来 构造 出 下 面 两 个 集合 : 
41 = {s € Sls 是 侦 数 } = {2,4,6} 
42 = {s € Sls 是 奇数 } = {1,3,5}. 
A1 和 A 能 和 否 构成 5 的 一 个 划分 ? 4; 和 hs 没有 相同 的 元 素 一 一 因为 一 个 正 整 
数 不 可 能 既是 偶数 又 是 奇数 一 一 它们 包含 了 5 的 所 有 可 能 值 , 因为 每 个 正 整 数 要 
么 是 偶数 , 要么 是 奇数 . 因此 , 4; 和 4s 的 确 构成 了 3 的 一 个 划分 . 
O 但 如 果 是 下 面 两 个 集合 , 情况 又 会 如 何 ? 


z 
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它们 能 不 能 构成 5 的 一 个 划分 ? 我 们 注意 到 4A1U 42 = 5, 所 以 每 种 可 能 的 结 
果 都 能 被 表示 出 来 . 但 


构成 一 个 划分 . 


A 


1 = {seE Sls<4 或 s 是 偶数 } = {1,2, 3, 4, 6} 


A2 = {se€ S|s 是 奇数 } = {1,3,5}. 


率 , 但 是 只 得 到 


征 


是 41n 4s = {1,3}, 因此 它们 不 是 不 相交 的 集合 , 从 而 无 法 


现在 你 可 能 会 问 , 划分 有 哪些 优点 ? 我 们 向 你 保证 , 它 不 仅仅 是 一 个 能 给 朋友 
留 下 深刻 印象 的 新 术语 . 我 们 会 经 常 遇 到 这 样 的 情况 : 
了 4 和 其 他 某 些 事件 B; 同时 发 生 的 概率 . 
例如 , 假设 我 们 知道 人 们 在 某 一 年 养 狗 且 得 流感 的 概率 是 0.08, 而 得 流感 但 没 


很 想 知道 事件 4 发 生 的 概 


养 狗 的 概率 是 0.07. 从 这 些 人 中 随机 选 出 1 个 , 那么 这 个 人 得 流感 的 概率 是 多 少 ? 


和 往常 一 样 , 我 们 可 以 利 


么 养 狗 , 要 么 不 养 狗 , 所 以 我 们 已 经 考虑 到 了 所 有 得 病 的 人 ， 因 此 , 得 病 的 概率 是 


期 望 计数 法 来 解决 问题 . 假设 一 共有 100 个 人 , 其 
中 有 8 个 人 既得 了 流感 又 养 狗 , 有 7 个 人 虽然 得 了 流感 但 并 没 养 狗 . 因为 人 们 要 


0.15. 注意 , 养 狗 和 不 养 狗 这 两 个 事件 构成 了 概率 空间 的 一 个 划分 . 因此 , 可 以 把 某 


人 得 病 的 概率 写 为 


Pr( 得 病 ) = Pr( 得 病 且 养 狗 ) + Pr 


得 病 且 不 养 狗 ). 


ore 


在 陈述 一 般 结论 之 前 , 我 们 先 复 习 一 些 符号 . 对 于 给 定 的 集合 {Bi1, Bo,…}, 对 


它 使 用 5j, 就 表示 把 所 有 项 都 加 起 来 . 如 果 想 要 同 


处 理 有 限 划分 和 无 限 划 分 , 那 


么 非常 正式 的 做 法 是 : 用 {B,}wer 来 表示 划分 中 的 元 素 , 用 并 ,-, Pr(41B,)-Pr(B,) 


来 表示 和 . 通常 


只 写 


和 守 。 因为 我 们 知道 它 代 表 了 什么 . 


全 概率 法 则 : 刀 


四 


未 


数 个 部 分 ), 那么 对 于 任意 的 4 c 5, 我 们 有 


{B1, B2,…} 构成 了 样本 空间 5 的 一 个 划分 (分 成 了 至 多 可 


Pr(4) = 》 Pr(AIB,). Pr(B,). 


对 于 所 有 的 n, 都 应 该 有 0 < Pr(Bn) < 1, 否则 条 件 概率 就 是 无 定义 的 (注意 ， 
如 果 有 一 个 B 的 概率 为 0, 那么 我 们 就 不 需要 这 个 B,, 了 , 因为 它 会 给 出 因子 
Pr(Bn) = 0; 但 如 果 它 的 概率 是 1, 那么 其 他 所 有 项 都 是 不 必要 的 ). 


证 明 ”考虑 集合 G = U,, 4Nn Bs 对 于 G 的 任意 一 个 元 素来 说 , 它 不 但 属 了 


4, 还 至 少 属于 一 个 B 所 以 我 们 可 以 把 G 写成 G = ANn (UU, Bn). 但 是 , 因为 B 
构成 了 5 的 一 个 划分 , 所 以 UU;, Bi, = 5, 这 意味 着 G = 4nS= 4. 因此 , 我 们 有 


Pr(A) = Pr(G) = Pr (Ua NN 中】 


Nn 
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为 了 更 加 整洁 , 令 4, = 4n B 于 是 , 表达 式 就 简化 成 了 


Pr(A) = Pr (U 4 


由 于 B; 构成 了 5 的 一 个 划分 ， 


可 加 性 , 我 们 有 


你 可 能 已 经 注意 到 ， 


计 养 狗 且 


Pr(4) = Pr (U ] = > Pr(An) = >》 Pr(ANB,). 


因此 A， 是 两 两 不 相交 的 . 那么 利用 不 相交 集合 的 


得 流感 的 人 所 


可 能 性 以 及 得 


概率 与 养 狗 的 人 得 流感 的 概率 相等 . 因此 ， 


的 局 限 性 


, 因为 我 们 很 难 算出 形 如 Pr(4Dm 


前 面 关 于 养 狗 和 得 流感 的 例子 中 有 些 奇怪 的 东西 : 谁 来 统 
5 的 百分比 ? 你 更 有 可 能 得 到 的 信息 是 , 得 流感 的 人 养 狗 的 
流感 的 人 不 养 狗 的 可 能 性 . 但 这 些 只 是 条 件 概率 ! 得 流感 的 人 养 狗 的 


虽然 上 面 的 定理 是 正确 的 , 但 它 有 一 定 
Bi) 的 概率 . 应 该 如 何 调整 这 个 定理 , 从 


而 把 它 与 条 件 概率 联系 起 来 ? 之 前 我 们 看 到 , 事件 4 和 B 同时 发 生 的 概率 是 


Pr(ANMB)= Pr( 


所 以 , 可 以 把 全 概率 法 则 写成 这 样 的 形式 : 
Pr(4) = 》 Pr(A|B;). Pr(B;). 
= 


也 可 以 将 其 写成 Pr(4) 
子 可 以 简化 成 沁 i_1 Pr(Bi|4) = 1, 而 这 没有 什么 特别 之 处 . 


下 一 个 问题 在 几 年 


= 5 Pr(BilA) 


A|B). Pr(B), 


.Pr(4). 但 是 , ( 当 Pr(4) 关 0 时 ) 这 个 式 


后 可 能 会 对 你 更 有 意义 ……… 


根据 一 些 研究 , 在 美国 大 约 有 30% 的 孕妇 分 娩 采 用 了 前 腹 产 , 有 0.2% 的 新 生 


儿 无 法 存活 . 在 不 采 
存活 率 是 多 少 ? 
解答 : 我 们 想 求 


示 分 娩 类 型 . 具体 地 说 , 让 Bi 表示 剖腹 产 ，Bs 表示 非 剖 腹 产 . 于 是 


这 和 


用 剖腹 产 时 , 婴儿 的 存活 率 是 99.1%. 根据 这 些 数据 , 新 生 儿 的 


的 是 Pr( 新 生 儿 存活 ). 


用 4 表示 新 生 儿 活 下 来 这 一 事件 , B 表 


Pr(4) = 2_Pr(AIB) . Pr(B;) 


= Pr(A|B1): Pr(B 
= (1 — 0.002) .301 


= 0.9931 = 99.31%. 


方法 是 可 行 的 , 因为 我 们 构造 了 两 个 不 相交 的 集合 , 即 剖腹 产 分 娩 和 非 章 


1) 十 Pr(A|B,) ’ Pr(B,) 
H (0.991) . (1 — 0.30) 


腹 产 分 娩 ， 它们 构成 了 一 个 划分 ， 根 据 全 概率 法 则 , 我 们 求 出 新 生 儿 的 存活 率 是 


99.31%. 
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4.6 ”回顾 贝 叶 斯 定理 


既然 我 们 已 经 给 出 了 划分 理论 和 全 概率 法 则 , 那么 现在 就 可 以 构造 一 般 版 本 的 
贝 叶 斯 定理 . 以 前 , 我 们 要 通过 下 面 的 式 子 来 计算 Pr(4|B), 即 
_ Pr(B|A): Pr(A) 

Pr(AIlB) = BO 
但 现在 我 们 假设 {41, 42,… , 4]} 是 样本 空间 5 的 一 个 划分 于是, 有 Pr(B) = 
Di_1Pr(B|4;) :Pr(4;). 因此 , 贝 叶 斯 定理 就 变 成 了 下 面 这 样 . 


贝 叶 斯 定理 : 设 {4;}?1 是 样本 空间 的 一 个 划分 , 那么 
Pr(B|A).: Pr(A) 
D>,_, Pr(B|Ai) :Pr(4i) 


Pr(A|B) = 


通常 情况 下 , 4 就 是 某 个 4;. 
波士顿 红 袜 队 即将 在 芬 威 球场 举办 一 场 主 场 比赛 . 近年 来 , 下 雨 的 比赛 日 平均 
占 到 了 30%. 在 那些 下 雨 的 日 子 里 , 85% 的 天 气 预 报 会 预测 下 南 . 在 不 下 雨 的 日 子 
里 , 只 有 20% 的 天 气 预 报 会 预测 下 雨 . 在 天 气 预 报 已 经 预测 了 红 袜 队 比 赛 当天 会 下 
雨 的 前 提 下 , 那天 下 雨 的 概率 是 多 少 ? 
解答 : 我 们 想 知 道 , 在 天 气 预报 已 经 预测 了 红 袜 队 比 赛 当 天 会 下 雨 的 前 提 下 ， 
那天 下 雨 的 概率 . 让 A1 表示 比赛 日 会 下 雨 的 事件 , 4s 表示 比赛 日 不 会 下 雨 的 事件 ， 
B 表示 天 气 预报 预测 会 下 雨 的 事件 . 
Pi(A1|B) = Pe ‘Pr(Ai) 
>,_, Pr(B|Ai) .Pr(A;) 
有 Pr(B|Ai1): Pr(Ai1) 
Pr(B|Ai1) :Pr(Ai)+ Pr(B|A,): Pr(A;) 
0.85 .0.30 
0.85 .0.30 十 0.20. (1 — 0.30) 


久 0.708 333. 


因此 , 在 已 知 天 气 预 报 预测 了 红 袜 队 比 赛 当 天 会 下 雨 的 前 提 下 , 这 一 天 会 下 雨 的 概 
率 大 约 是 0.645 57, 或 者 约 为 65%. 


158 第 4 章 


条 件 概率 、 独 立 性 和 贝 叶 斯 定理 


本 章 是 对 一 般 理论 的 扩 


4.7 


的 
/CE 


它们 用 起 来 ; 


不 总 是 那么 方 


为 两 个 独立 事件 同时 发 4 


结 
展 . 我 们 已 经 看 到 , 虽然 基本 概率 规则 足以 解决 问题 , 但 
便 . 为 了 简化 这 些 计算 , 我 们 需要 把 有 用 的 结果 分 离 
来 . 本 音 的 两 个 重要 概念 就 是 独立 性 和 条 件 概 率 . 

我 们 的 愿望 是 找到 独立 事件 , 因 


有 依赖 关系 的 . 某 个 


有 件 的 发 和 4 


单独 发 生 的 概率 有 关 , 它们 之 间 不 会 相互 作 / 


[人 .局 / 
会 影 


容 之 一 源 


自 《 星 球 大 战 5: 闻 


季 国 


反击 战 》. 


.然而 在 大 多 数 性 


“千年 集 号 ”了 


战斗 机 追逐 . 汉 “ 索 洛 是 “千年 信号 ” 


图 摆脱 追赶 者 . 


的 船长 ， 


他 决定 将 这 艘 飞船 驶 入 小 行 


C-3P0: 长 官 , 成 功 飞 越 小 行星 带 的 概率 大 约 是 1/3720. 
汉 索 洛 : 永远 不 要 告诉 我 机 会 有 多 大 . 


即便 是 在 未 来 (或 者 是 过 去 ， 
我 们 也 会 看 到 条 件 概 率 . C-3P0 并 不 担心 汉 ” 索 洛 平时 
带 的 前 提 下 , 汉 索 洛 轨 驶 “千年 储 号 ”的 能 力 . 
中 最 重要 的 就 是 贝 叶 斯 定 
j 这 些小 事件 的 概率 


在 已 知 要 驶 入 一 个 小 行星 
我 们 给 出 了 几 个 关于 条 件 概率 和 独立 事件 的 公式 ， 
理 . 它 的 思路 是 , 样本 空间 可 以 被 划分 成 一 些 更 简单 的 事 
E 够 容易 地 计算 出 来 . 然后 我 们 要 把 事件 的 各 部 分 组 合 起 来 ， 
] 提 供 了 这 样 一 个 框架 . 
我 认为 这 里 有 大 量 类 似 于 代数 运算 的 内 容 : 通 


= I 


/ 


他 方法 更 简单 , 而 且 


具有 局 发 性 . 


因为 《星球 大 战 》 的 


的 驾驶 技能 ; 


秆 
| 


LL 


E 的 概率 只 与 每 个 事件 
4 况 下 , 事件 之 间 是 
响 另 一 个 事件 发 生 的 概率 . 我 最 喜欢 引用 的 内 
E 在 被 星际 驱逐 舰 和 TIE 


[三 
生 市， 


试 


背景 似乎 被 设 定 在 很 久 以 前 )， 
也 担心 的 是 ， 


而 贝 叶 斯 定理 就 为 我 
常 , 考察 表达 式 的 某 种 方法 要 比 


贝 叶 斯 定理 的 要 点 是 , 允 次 
率 (这 些 概 率 通常 是 给 定 的 , 或 者 较 容易 计算 ) 来 计算 另 一 组 概率 (这 些 概率 通常 
不 是 给 定 的 , 而 且 不 容易 计算 ). 这 类 似 于 在 多 元 微 积 分 中 改变 积分 的 次 序 : 有 时 


从 某 个 特定 角度 考察 问题 能 使 代数 运算 更 加 容易 . 


下 一 章 将 继续 研究 离散 事件 的 概率 , 现在 我 们 已 经 掌握 了 这 些 附 加 工 


习题 4.8.1 


回 到 对 Pr(A|B) 贞 


4.8 习 


的 猜想 , 我 们 试 着 把 


函数 ， 当 我 们 考 


的 概率 是 1, 而 


虑 条 件 概 率 时 , 考察 以 Pr(B) 为 分 母 t 
当 已 知 B 发 生 时 , 某 事 发 生 的 概率 ; 可 以 将 其 视 为 对 术 
其 他 概率 也 要 做 出 相应 的 调整 ). 我 们 能 得 到 的 最 简单 的 公式 是 


Ff 我 们 利用 一 组 概 


题 


[人 


候 ， 


上 


YY 


(还 将 


它 写成 关于 Pr(4),Pr(B) 和 Pr(4NnB) 的 
的 比值 是 很 合理 的 (我 们 试图 
# 本 空间 的 调整 , 所 以 现在 B 发 4 


求 出 


Pr(4lB) = aPr(A) Ee NB) 


通过 考察 极端 情况 , 能 使 表达 式 有 意义 的 唯一 选择 是 a = 0 和 6 = 1. 注意 , 这 显然 不 是 
对 上 述 公 式 的 证 明 , 只 是 一 个 补充 说 明 . 更 多 内 容 请 参阅 2.7 节 , 尤其 是 2.7.2 节 . 
习题 4.8.2 ”一 个 事件 能 否 依赖 于 另 一 个 概率 为 0 的 事件 ? 证 明 你 的 答案 . 
习题 4.8.3 ” 找 出 三 个 满足 Pr(AN BNMO) = Pr(4) .Pr(B):Pr(C) 的 事件 , 并 且 其 中 至 少 有 
两 个 事件 是 相互 依赖 的 . 
习题 4.8.4 如果 4、B 和 C 是 相互 独立 的 事件 , 那么 Pr(4nBnC) = Pr(4)Pr(B)Pr(C)， 
Pr(AN B)= Pr(A)Pr(B), Pr(ANMC) = Pr(A)Pr(C) H Pr(B NO)= Pr(B)Pr(O). 因 
此 , 我 们 需要 验证 4 个 条 件 . 如 果 A1,… ,4 是 相互 独立 的 , 那么 需要 验证 多 少 个 条 件 
呢 ? 
习题 4.8.5 ”考虑 下 面 这 个 问题 , 它 是 对 第 1 章 习 题 1.5.17 关于 篮球 题目 的 修改 . 假设 拉 
伯 德 第 二 个 投篮 , 而 且 拉 里 ” 伯 德 命中 的 概率 取决 于 魔术 师 约 翰 逊 是 否 在 这 一 轮 命 
Ph (想象 一 下 , 拉 里 投 得 更 好 还 是 更 差 ),， 当 已 知 魔术 师 约 翰 逊 命中 时 ， 
立 里 ” 伯 德 的 命中 率 是 a.p; 术 师 约翰 逊 未 命中 时 , 拉 里 ” 伯 德 的 命中 率 是 2( 其 
hoga.p<1,0<2?<1). 计算 拉 里 伯 德 获胜 的 概率 . 
习题 4.8.6 ”想象 你 正在 树林 里 散步 . 到 目前 为 止 , 你 遇 到 了 一 只 主 红 涛 、 三 只 应 和 两 具 花 栗 
鼠 ， 你 想 预 测 接 下 来 会 遇 到 什么 动物 . 直觉 告诉 你 , 看 到 一 只 主 红 瞧 的 概率 是 1/6, 看 
到 一 只 鹿 的 概率 是 3/6, 看 到 一 只 花 栗 鼠 的 概率 是 2/6. 然而 , 这 有 些 让 人 感到 不 安 . 按 
照 你 的 估计 , 看 到 一 只 松鼠 的 概率 是 0, 这 是 非常 荡 鹰 的， 有 一 种 方法 是 把 尚未 见 过 的 
动物 当 作 一 类 , 并 假设 你 曾 见 过 一 次 “尚未 见 过 的 动物 ”， 因 此 , 除了 主 红 和 省、 鹿 和 人 花 
栗鼠 之 外 , 出现 其 他 动物 的 概率 就 是 1/7， 对 于 这 个 “尚未 见 过 的 动物 ”的 练习 , 拉 普 
拉 斯 给 出 了 一 个 不 同 的 解决 方案 . 他 在 每 个 物种 的 数量 上 都 加 了 一 . 如 果 我 们 已 经 遇 到 
了 s 种 动物 , 并 且 第 有 种 动物 出 现 了 si 次 , 那么 拉 普 拉 斯 认为 见 到 第 大 种 动物 的 概 
率 应 该 是 (sg 十 1)/(1 十 总?_i(sx 二 1)， 因 此 , 遇 到 尚未 见 过 的 动物 的 概率 就 应 该 是 
1/(1 十 3%_1(sx 十 1)). 在 这 个 例子 中 , 按照 拉 普 拉 斯 的 方法 , 我 们 遇 到 一 只 主 红 稚 的 概 
率 是 2/10, 遇 到 一 只 鹿 的 概率 是 4/10, 遇 到 一 只 花 栗 鼠 的 概率 是 3/10, 而 过 到 一 种 新 动 
物 的 概率 是 1/10. 为 什么 拉 普 拉 斯 的 方法 与 我 们 的 不 同 ? 特别 是 , 拉 普 拉 斯 方程 对 哪些 
参数 敏感 , 而 我 们 的 却 不 是 ? 
习题 4.8.7 ”在 已 知 红 袜 队 赢得 了 某 年 世界 职业 棒球 大 赛 冠 军 的 前 提 下 , 该 队 的 OPS 超过 
0.800 的 概率 是 70%.， (你 可 能 不 知道 什么 是 OPS, 它 是 棒球 比赛 中 的 命中 统计 数字 , 这 
个 数 越 高 越 好 . 这 些 数 都 是 经 验 指数 , 但 是 红 袜 队 在 2004 年 和 2007 年 的 OPS 确实 超过 
了 0.800, 在 2013 年 却 没 有 . ) 红 袜 队 的 OPS 超过 0.800 的 概率 是 30%, 他 们 赢得 世界 
职业 棒球 大 赛 冠 军 的 概率 是 10%. 如 果 已 知 该 队 的 OPS 超过 了 0.800, 那么 红 袜 队 赢 得 
某 年 世界 职业 棒球 大 赛 冠 军 的 概率 是 多 少 ? 
习题 4.8.8 ”如 果 抛 撕 三 枚 山子 的 点 数 和 是 7, 那么 至 少 有 一 枚 山子 的 点 数 是 1 的 概率 为 多 
少 ? 


习题 4.8.9 ”抛掷 两 枚 仍 子 , 如 果 有 一 枚 角 子 的 点 数 是 奇数 , 那么 它们 点 数 的 乘积 恰好 包含 
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个 素 
习题 4.8.10 


因子 的 概率 是 


/> 


少 (两 


人 


大 


子 不 一 定 


如 果 我 们 手 里 才 


数 相同 的 概率 是 多 少 ? 


习题 4.8.11 


了 袋子 之 后 ， 
的 弹 珠 , 这 
色 的 弹 珠 , 人 


拿 到 了 蓝 1 
习题 4.8.12 

所 有 弹 珠 

的 袋子 
习题 4.8.13 


方形 所 在 的 位 置 时 , 向 左 移动 的 概率 是 0.1 . k, 向 右 移动 


自 
取出 一 颗 弹 珠 . 他 能 


办 犯 获得 了 一 个 夫 


也 就 可 以 从 袋子 


4 


目 


本 题 的 设置 与 上 


5 张 


趣 的 假释 


拿 出 一 颗 


单 珠 摸 起 来 是 一 样 的 . 如 果 他 拿 到 了 一 个 颗 红 
岂 的 假释 部 


题 类 


i 会 被 拒绝 


也 分 配 到 两 个 袋 


上 得 
厂 体 


子 里 . 


会 . 


以 ; 不 同 的 
也 仍然 要 闭 


相同 )? 


复 , 而 且 至 少 有 2 张 牌 的 点 数 相 


关 


也 要 闭 


眼 从 两 个 袋子 


弹 珠 . 每 个 袋 - 


者 在 


25 颗 红 1 


. 他 能 
也 方 


得 假释 f 


-7 


自 


的 


最 大 概率 是 多 少 ? 订 


我 们 有 11 个 正方 形 


号 正方 形 为 起 点 , 而 
会 向 右 移 动 的 概率 是 多 少 ? 


和 二 
醋 


Ns 
人 少 


, 它们 的 编 


知道 我 们 的 终点 是 7 号 


号 从 左 至 


| 右 依次 为 0 ~ 10. 当 我 们 处 了 
的 概率 是 1 一 0.1 .kk， 如果 以 5 


E 方 形 或 者 7 


号 之 后 的 了 


的 . 


日 同 , 那么 至 少 有 3 张 牌 点 


选择 一 个 . 在 选 定 
色 和 25 颗 蓝 1 
色 的 弹 珠 , 就 会 被 释放 ; 如 果 
的 机 会 是 多 少 ? 
于 , 现在 犯人 可 以 按照 自己 的 意愿 把 
眼 随机 地 选择 一 个 袋子 , 然 
E 明 你 的 答案 是 最 人 


色 


后 从 选 定 


六 大 号 了 


E 方 形 , 那么 我 们 


习题 4.8.14 ”假设 0 < Prob(X), Prob(Y) < 1 并 且 X 和 YY 是 相互 独立 的 . 那么 X* 和 


Y* 是 相互 独立 的 吗 ? (注意 , X“ 是 “ 非 X”, 或 者 Q \ XX. ) 证 明 你 的 结论 . 


习题 4.8.15 ” 某 家 保险 公司 为 10 000 户 家 庭 提供 保险 , 每 户 每 年 需 文 付 5000 美元 . 如 果 房 
屋 被 毁 , 房 主 将 得 到 100 000 美元 . 假定 任何 房屋 的 损坏 都 与 其 他 房屋 相互 独立 . 每 栋 房 
屋 在 某 年 被 毁坏 的 概率 都 是 p. 计算 保险 公司 在 这 一 年 能 够 赚钱 的 概率 (写成 关于 p 的 
表达 式 ). 

习题 4.8.16 ”上 一 题 的 假设 是 否 合理 ? 解释 为 什么 合理 或 为 什么 不 合理 . 

习题 4.8.17 ”你 认为 一 辆 车 出 现在 某 一 特定 地 点 的 概率 与 其 他 车 出 现在 某 些 地 点 的 概率 有 
关系 吗 ? 请 给 出 解释 . 


习题 4.8.18 


的 概率 为 多 


一 个 人 的 


在 英文 中 , 字母 H 出 现 的 概率 大 约 是 6%. 字母 工 出 现 的 概率 大 概 是 9%. 双 
字母 组 TH 出 现 的 可 能 性 约 为 1.5%. 如 果 知道 第 一 个 字母 是 T, 那么 第 2 个 字母 是 HH 


少 ? 


划 


一 组 基因 


遗传 的 其 他 等 亿 
么 他 就 是 A 型 


凡人 至 


惊 寺 


该 基 


种 可 和 外 


血 . 如 果 是 BB 或 BO, 那 他 就 


] 


Et 


AB, 那么 他 的 


到 


习题 4.8.19 
习题 4.8.20 
习题 4.8.21 

人 所 占 日 
习题 4.8.22 


它 的 牌 型 与 其 


的 比例 . 


电 就 是 AB. 不 妨 设 有 45 兄 上 


it 是 B 型 
内 全 


定 的 ， 假 设 一 个 人 遗传 某 个 等 位 基因 


[a} 


大 


等 位 基 


已 知 
计算 Justine 的 如 
A 型 


本 
旺 . 


得 州 寺 


他 们 要 根 和 


Justine 是 O 型 


的 人 既 可 以 输入 A 型 


包 扑克 游戏 一 样 . 
这 5 张 牌 以 及 手中 的 2 张 牌 尽量 组 


1, 计算 灿 


由 


是 


+ 


也 


已 


的 父母 具有 每 种 


也 是 O 型 


的 概率 . 


型 的 概率 . 


, 也 可 以 输入 O 型 


克 是 一 种 常见 的 扑克 牌 游 戏 , 每 个 玩 


. 计算 能 为 A 型 


必 z | 


式 有 有 


会 拿 到 2 张 牌 ,然后 者 


男 外 ,还 在 


5 张 牌 是 所 有 
合 出 最 4 


的 概率 完全 独立 于 
E 性 , 即 A、B 和 O. 如 果 某 人 是 AA 或 AO, 那 
. 如 果 是 OO, 那 就 是 O 型 


他 


; 如 果 是 


O, 40% 是 A, 而 剩 下 的 15% 是 B. 


输 


要 | 


二 
Cy 


注 


玩家 都 能 看 到 的 . 对 玩家 来 说 ， 


tC 穆 型 . 玩 得 州 扑克 时 , 在 已 知 手 


中 是 哪 2 张 牌 的 前 提 下 , 知道 自己 获胜 的 概率 是 非常 有 用 的 . 写 


段 代 码 , 通过 模拟 来 估 


算 在 已 知 前 2 张 牌 的 前 提 下 , 拿 到 不 同 牌 型 的 概率 . (为 了 避免 对 7 张 牌 的 牌 型 比较 大 小 ， 


你 可 以 假设 只 有 3 张 公共 牌 . ) 
习题 4.8.23 ”在 开始 时 , 假设 你 拿 到 了 3@ 和 3S9,， 而 你 
一 题 的 代码 来 模拟 你 能 赢 的 概率 . 


习题 4.8.24 ” 设 Q 中 有 了 个 元 素 . 对 于 每 一 个 ke {1,… ,nn}, 把 9 恰好 分 成 天 个 集合 


划分 有 多 少 种 ? 


的 对 手 拿 到 了 AS 和 8 人 , 请 调整 上 


习题 4.8.25 ”我 们 再 看 看 上 一 个 习题 . 假设 9 的 所 有 划分 都 是 等 可 能 的 . 如 果 n = 4, 那么 


划分 中 的 所 有 集合 都 具有 相同 数量 元 素 的 概率 是 多 少 ? 对 了 


一般 的 n, 你 能 给 出 答案 吗 ? 


习题 4.8.26 ”我 们 抛 括 一 枚 硬币 , 出 现 正面 的 概率 是 0.2, 出 现 反面 的 概率 是 0.8. 如 果 硬 币 
出 现 正面 , 那么 我 们 接着 抛掷 两 颗 均 匀 ( 且 独 立 ) 的 骨 子 ， 如 果 出 现 反 面 , 就 抛 撕 三 颗 均 


匀 的 明 子 . 最 子 点 数 之 和 等 于 3 的 概率 是 多 少 ? 
习题 4.8.27 利 


选中 的 可 能 性 是 相等 的 . 在 选 定 了 区 间 之 后 , 从 该 区 


间 内 随机 取出 一 个 整数 m, 而 且 该 区 


间 内 所 有 整数 被 选中 的 可 能 性 都 是 相等 的 . 那么 m 是 区 间 [1001， 


全 概率 法 则 证 明 : 如 果 4 c B, 那么 Pr(4) < Pr(B). 
习题 4.8.28 ”考虑 区 间 [1, 102] 和 [1001, 1102]. 我 们 随机 地 选 出 一 个 


区 间 , 并 且 每 个 区 间 被 


1102] 中 的 一 个 素数 的 


概率 是 多 少 ? m 是 素数 的 概率 为 多 少 ? 注意 , 这 两 个 区 


是 素数 的 概率 只 取决 于 该 区 间 所 包含 的 整数 个 数 吗 ? 


x 


间 包 含 了 相同 数量 的 整数 ; 一 个 数 


问题 中 , 可 能 情况 和 子 情况 的 数量 迅速 增加 , 这 让 我 们 很 快 就 感到 了 泪 表 . (我 自 
是 这 样 的 一 一 我 花 了 儿 个 小 时 来 研究 桥牌 牌 局 ! ) 我 们 看 到 了 兼顾 所 有 可 


的 帮 


第 5 章 ”计数 II: 容 斥 原 理 


维 益 尼 :” 那 还 不 简单 . 我 要 做 的 就 是 根据 我 对 你 的 了 解 来 猜测 : 你 会 把 毒药 


放 进 自己 的 酒杯 还 是 敌人 的 酒杯 ? 聪明 人 会 把 毒药 放 进 他 自己 的 酒 
杯 里 , 因为 他 知道 只 有 大 傻瓜 才 会 接受 别人 给 的 东西 . 我 不 是 个 大 傻 
瓜 , 所 以 我 肯定 不 会 选择 你 面前 的 酒 . 但 你 一 定 知道 我 不 是 个 大 僵 瓜 ， 
你 放 毒 药 时 就 知道 ; 所 以 , 我 显然 不 能 选择 自己 面前 的 酒 . 


黑 衣 人 : 那么 你 已 经 做 出 决定 了 ? 
维 座 尼 : 还 没有 . 


我 们 在 第 3 章 中 介绍 了 阶乘 函数 和 二 项 式 系数 , 并 和 多 
计算 问题 . 虽然 我 们 解决 了 许多 问题 , 但 并 不 是 所 有 问题 都 可 以 解决 . 在 一 些 简单 
己 
能 


性 有 多 么 


一 一 “智慧 之 战 ”, 出 自 《 公 主 新 娘 》(1987) 


do 


用 它们 成 功 地 解决 了 许 


/ 


内 难 , 而 且 存 在 重复 计数 和 遗漏 条 些 情况 的 风险 . 一 个 很 好 的 例子 是 3.4.2 


要 


数 ， 


这 两 和 


节 的 完美 牌 局 问题 : 恰 有 一 个 人 拿 到 13 张 同 花色 牌 的 概率 是 多 少 ? 显然 , 我 们 需 
用 更 好 


的 方法 计算 


本 章 


的 结构 与 第 3 章 类 似 . 在 5.1 节 中 , 我 们 将 快速 回顾 阶乘 函数 和 二 项 式 系 


并 且 给 出 两 个 新 内 容 . 第 一 个 涉及 循环 次 序 , 它 是 介 于 考虑 次 序 和 不 考虑 次 序 


极端 情况 之 间 的 情形 . 第 二 个 是 求 出 满足 特定 要 求 的 套装 有 多 少 种 . 我 们 将 


采用 简单 直接 和 聪明 巧妙 的 两 种 方法 来 解决 这 个 问题 . 这 种 聪明 的 想法 并 不 是 只 能 
用 在 这 里 的 奇迹 , 而 是 可 以 不 断 用 来 简化 各 种 情况 的 计算 . 因此 , 我 们 将 利用 它 引 
入 一 个 新 技巧 , 即 容 斥 方法 , 然后 再 探讨 几 个 新 的 问题 , 并 重 温 一 些 旧 问题 . 


我 们 


将 继续 讨论 一 些 著名 的 组 合 问题 . 对 概率 论 来 说 , 乍 一 看 这 似乎 并 不 是 个 


合适 的 话题 . 当然 , 有 些 人 觉得 组 合 学 很 有 趣 , 但 它 不 应 该 是 离散 数学 的 内 容 吗 ? 虽 
然 本 书 不 会 涉及 更 深层 次 的 组 合理 论 , 但 这 里 必须 要 涵盖 一 些 基 本 理论 ; 毕竟 , 大 
部 分 概率 都 与 计数 有 关 . 我 们 看 看 成 功 了 多 少 次 , 它们 都 与 哪些 可 能 情况 有 关 . 

个 很 好 的 例子 是 彩票 , 特别 是 那些 从 N 个 数 中 以 任意 次 序 挑选 出 个 数 的 例子 . 


当 不 允许 重复 使 用 数 时 , 找 出 失败 的 概率 是 个 可 行 的 办 法 ; 但 是 , 如 果 允 许 重 复 使 


用 数 , 那么 事情 就 变 得 很 有 趣 了 . 我 会 告诉 你 一 个 解决 该 问题 的 绝妙 主意 . 最 后 , 我 


们 好 


要 做 一 


些 典 型 问题 , 例如 著名 的 Mississippi 问题 [有 人 给 了 你 Mississippi 这 个 单 
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词 , 想 知道 由 其 中 6 个 字母 组 成 的 一 个 (可 能 是 无 意义 的 ) 单词 中 恰好 出 现 3 个 s 
的 概率 ]. 这 并 不 是 个 容易 解决 的 问题 , 尽管 在 仓促 的 课堂 上 它 看 起 来 好 像 并 不 难 . 
这 个 问题 的 解 可 以 用 多 项 式 系数 来 表示 , 这 里 的 多 项 式 系数 是 由 二 项 式 系数 推广 而 


5.1 阶乘 和 二 项 式 问题 


日 常生 活 为 我 们 提供 了 应 用 阶乘 函数 和 二 项 式 系数 的 大 量 机 会 . 对 于 那些 可 
以 解决 的 问题 , 下 面 给 出 了 一 个 小 却 有 代表 性 的 例子 . 有 时 , 我 们 会 称 其 为 计数 问 
题 (实现 X 有 多 少 种 方法 ), 但 有 时 也 会 把 它 当 作 概 率 练习 (Y 发 生 的 概率 是 多 少 ). 
这 两 种 看 法 可 以 轻松 地 进行 转换 . 例如 , 从 计数 问题 转换 到 概率 问题 , 我 们 要 做 的 
就 是 让 想 要 的 结果 数 除 以 可 能 的 结果 总 数 . 


5.1.1 “有 多 少 个 ”与 “概率 是 什么 ” 


我 们 先 陈 述 问题 , 然后 再 讨论 一 个 关键 议题 , 只 有 经 过 长 时 间 (但 重要 的 ) 讨论 
才能 解决 问题 . 

问题 : 想象 一 下 , 有 20 个 人 申请 美国 机 器 人 和 机 械 人 公司 的 职位 . 假设 他 们 
中 有 10 个 人 没有 经 验 , 7 个 人 恰 有 一 年 的 经 验 , 3 个 人 恰 有 两 年 的 经 验 , 而 且 每 个 
人 都 等 可 能 地 被 选中 . (1) 从 中 选 出 6 个 人 来 公司 工作 的 方法 有 多 少 种 ? (2) 选 出 6 
个 特定 的 人 的 概率 是 多 少 ? (3) 选 出 的 6 名 员工 都 没有 经 验 的 概率 是 多 少 ? 

在 解决 这 个 问题 之 前 , 应 该 仔细 研究 一 下 题目 . 我们 看 到 , 在 生日 问题 (第 1 
章 ) 中 , 我 们 花 了 很 长 时 间 才 能 正确 地 益 述 问题 . 这 个 问题 似乎 叙述 得 很 清晰 , 但 有 
趣 的 是 , 其 中 一 部 分 并 非 如 此 ! 这 里 有 个 微妙 的 隐 含 假设 . 事实 上 , 你 几乎 肯定 会 
做 出 这 样 的 假设 . 许多 老师 和 图 书 甚 至 都 没有 意识 到 这 一 假设 的 存在 . 

这 里 有 什么 问题 ? 第 一 问 (方法 有 多 少 种 ) 和 第 二 问 (概率 是 多 少 ) 之 间 有 很 
大 的 不 同 . 我 们 在 2.4 节 中 定义 了 概率 空间 . 它 是 一 个 三 元 组 , 包含 结果 空间 Q 和 
一 个 对 9 的 子 集 分 配 概率 的 函数 , 而 这 些 子 集 共同 构成 了 一 个 特殊 的 集合 (o 代 
数 )， 如 果 我 们 提出 “有 多 少 个 ”的 问题 , 那么 只 需要 列 出 一 份 可 能 情况 的 清单 就 
行 了 . 

如 果 想 求 概率 , 那么 就 要 了 解 一 些 与 概率 函数 有 关 的 东西 . 不 管 怎样 , 我 们 需 
要 得 到 关于 如 何 对 集合 分 配 概率 的 信息 . 对 我 们 有 帮助 的 表达 应 该 是 : 每 个 人 都 等 
可 能 地 被 选中 . 这 句 话 应 该 用 来 指定 概率 函数 , 但 不 幸 的 是 它 有 些 含糊 . 你 所 期 户 
的 最 自然 的 假设 是 , 每 & 个 人 被 选中 的 可 能 性 都 与 其 他 任意 个 人 是 一 样 的 . 这 
直接 表明 了 每 个 人 被 选中 的 可 能 性 与 其 他 人 相等 ; 然而 , 我 们 也 可 以 为 不 同 组 分 配 
不 一 样 的 概率 , 但 同时 保证 每 个 人 都 等 可 能 地 被 选中 . 


叹 
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为 了 强调 这 一 点 , 我 们 来 看 一 个 更 简单 的 例子 .假设 我 们 有 四 个 人 :; 昂 内 塔 


(Agnetha)、 班 尼 (Benny)、 


比 约 恩 (Bjarn) 和 安妮 - 弗 瑞 德 (Anni-Frid), 我 们 希望 组 


成 一 个 二 人 组 . 是 的 , 这 里 没有 使 用 标准 的 Alice、Bob、Charlie 和 Dan 一 一 别 着 


急 , 使 用 这 些 名 字 是 有 原因 
个 人 有 ( = 6 种 方法 . 这 


的 ! 我 们 先 回 答 “ 有 多 少 个 ”的 问题 . 从 四 个 人 中 选 出 两 
6 种 可 能 的 选 法 是 { 昂 内 塔 , 班 尼 }、{ 昂 内 塔 , 比 约 恩 }、 


{ 昂 内 塔 , 安妮 - 弗 瑞 德 }、{ 班 尼 , 比 约 恩 }、{ 班 尼 , 安妮 - 弗 瑞 德 } 和 { 比 约 恩 , 安妮 - 


现在 ,我 们 来 解释 为 


弗 瑞 德 }. 一 共有 6 个 组 , 每 个 人 都 恰好 出 现在 其 中 3 组 里 . 那么 该 如 何 回答 “概率 
是 什么 ”的 问题 呢 ? 如 果 所 
率 都 是 1/6. 同样 地 , 每 个 人 被 选中 的 概率 也 是 一 样 的 (因为 每 个 人 都 恰好 出 现在 
其 中 3 组 里 ), 这 个 概率 就 是 1/2. 


有 组 被 选中 的 概率 都 是 一 样 的 , 那么 选中 任意 一 组 的 概 


么 要 选择 这 几 个 名 字 , 以 及 为 什么 要 组 成 一 个 二 人 组 ， 


并 对 上 述 内 容 给 出 非常 合 : 


理 的 阐释 . 这 是 4 位 非常 有 名 的 人 : 昂 内 塔 ” 费 尔 特 斯 


科 格 、 班 尼 ”安德森 、 比 约 恩 ” 奥 瓦 尔 斯 和 安妮 - 弗 瑞 德 ” 林 斯 塔 德 ， 他 们 共同 


组 建 了 ABBA 合唱 团 , 这 是 有 史 以 来 最 受 欢迎 的 乐队 之 一 ，( 以 我 落伍 的 观点 看 ) 
也 是 最 伟大 的 音乐 团体 之 一 . 昂 内 塔 和 比 约 恩 结 成 了 夫妇 , 班 尼 和 安妮 - 弗 瑞 德 也 


结婚 了 ， 后 来 这 两 对 夫妻 都 离婚 了 , 我 们 可 以 说 每 个 人 都 不 愿意 和 他 们 以 前 的 配 
偶 分 在 同一 组 ， 从 四 个 人 中 选 出 两 人 仍 有 6 种 方法 , 但 是 { 昂 内 塔 , 比 约 恩 } 和 


{ 班 尼 , 安妮 - 弗 瑞 德 } 的 概率 都 是 0, 而 { 昂 内 塔 , 班 尼 }、{ 昂 内 塔 , 安妮 - 弗 瑞 德 }、 
{ 班 尼 , 比 约 恩 } 和 { 比 约 恩 
概率 仍 是 1/2. 例如 , 班 尼 出 现在 其 中 两 组 里 , 并 且 每 一 组 被 选中 的 概率 都 是 1/4， 
所 以 班 尼 被 选中 的 概率 就 是 1/4 + 1/4 即 1/2. 每 个 人 被 选中 的 概率 仍然 相等 , 但 
每 一 组 被 选中 的 概率 就 不 一 样 了 . 
哪个 解释 是 正确 的 ? 两 种 解释 都 是 有 效 的 , 并 且 概 率 函 数 的 分 配 也 都 合理 . 不 
管 谁 提 出 这 类 问题 , 首先 考虑 的 都 应 该 是 使 用 细致 、 精 确 的 语言 来 阐述 . 因此 , 通 
常情 况 下 , 问题 的 提出 者 想 说 的 是 每 个 组 都 等 可 能 地 被 选中 . 如 果 每 个 组 都 等 可 能 


, 安妮 - 弗 瑞 德 } 的 概率 都 是 1/4. 现在 , 每 个 人 被 选中 的 


地 被 选中 , 那么 每 个 人 被 选中 的 可 能 性 也 都 相等 , 并 且 他 与 任何 一 个 人 或 一 小 部 人 


分 在 同一 组 的 概率 都 与 其 他 任何 同 规模 分 法 的 概率 相等 . 但 反 过 来 就 不 对 了 . 根据 


每 个 人 都 等 可 能 地 被 选中 ， 


我 们 无 法 推出 每 一 组 也 等 可 能 地 被 选中 . 在 ABBA 的 


例子 中 , 6 组 中 有 2 组 的 概率 是 零 . 如 果 我 们 要 解决 的 是 “有 多 少 个 ”的 问题 , 那 
么 这 两 组 仍然 会 被 计算 在 内 ; 但 在 “概率 是 什么 ”的 问题 中 , 它们 就 不 会 被 加 到 概 


率 中 . 
这 是 一 段 元 长 的 陈述 


但 不 会 是 你 最 后 一 次 在 本 书 中 见 到 , 因为 它 值得 我 们 回 


顾 . 要 保证 精确 性 . 没 错 , 精确 性 往往 会 导致 长 篇 大 论 , 但 你 的 目的 是 确保 所 有 内 


容 的 一 致 性 . 想象 一 下 有 人 让 你 从 昂 内 塔 ” 费 尔 特 斯 科 格 、 班 尼 ”安德森 、 比 约 


恩 奥 瓦 尔 斯 和 安妮 - 弗 瑞 德 ” 林 斯 塔 德 中 选 出 一 个 二 人 组 , 并 且 要 求 每 个 人 被 选 
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中 的 概率 相等 . 在 许多 圈子 里 , 他 们 之 间 的 纠纷 是 众所周知 的 (乐队 以 25 亿美 元 
的 价格 重组 ! ), 所 以 人 们 可 能 会 认为 昂 内 塔 和 比 约 恩 显然 不 会 在 一 组 , 而 班 尼 和 安 


妮 - 弗 瑞 德 也 不 可 能 在 一 组 . 下 笔 的 时 候 要 写 ; 


5.1.2 


在 再 


中 有 10 个 人 没有 经 验 , 7 个 人 恰 有 一 年 的 经 验 , 3 个 人 恰 有 两 年 的 经 验 ; 


选 组 


经 过 上 面 的 讨论 , 解决 方案 是 比较 简 身 
把 这 个 问题 重新 叙述 一 避 . 我 们 会 使 用 第 一 种 解释 ， 也 就 是 说 , 每 
能 地 被 选中 . 


青 楚 . 不 要 成 为 误解 的 根源 . 


明了 的 . 我 们 已 经 说 了 很 多 题 外 话 , 现 


组 都 等 可 


问题 : 想象 一 下 , 有 20 个 人 申请 美国 机 器 人 和 机 械 人 公司 的 职位 . 假设 他 们 


而 且 每 个 


人 都 等 可 能 地 被 选中 , (1) 从 中 选 出 6 个 人 来 公司 工作 的 方法 有 多 少 种 ? (2) 选 出 6 


个 特定 的 人 的 概率 是 多 少 ? (3) 选 出 的 
的 首选 , 也 可 能 勉强 被 录用 . 但 无 论 在 哪 利 
就 是 二 项 式 系数 . 我 们 要 从 20 个 人 中 选 


选 法 的 概率 相等 . 因 


6 名 员工 都 没有 经 验 的 概率 是 多 少 ? 


(1) 在 这 个 问题 中 , 首先 要 注意 的 是 次 序 并 不 重要 . 一 个 员工 可 能 会 成 为 公司 
情况 下 、 不 管 排 在 什么 位 置 , 他 最 终 都 被 
聘用 了 . 当 次 序 无 关 紧 要 时 , 我 们 已 经 看 到 了 如 何 计算 挑选 员工 的 方法 数 一 一 它 


(2) 我 们 将 采 


人 被 选中 的 概率 就 是 1/38 760. 


(3) 为 了 求 出 选中 的 6 名 员工 都 没有 工作 经 验 的 概率 , 我 们 要 计算 如 果 只 选择 


上 6 个 , 所 以 答案 是 (20) 
第 一 种 解释 , 也 就 是 说 , 选 出 6 个 人 的 任意 一 种 方法 都 与 其 他 
为 一 共有 (20) = 38 760 种 不 同 的 选 法 , 所 以 任意 6 个 特定 的 


— 20! 
6!14! 


= 38 760. 


那些 没有 工作 经 验 的 人 
群体 中 挑选 出 6 名 工人 的 问题 . 没有 经 验 的 了 
经 验 的 员工 有 (0) 
都 与 其 


10! _ 
6!4! 


好 选 法 的 概率 相等， 


共有 多 少 种 不 同 的 选 法 . 这 只 不 过 是 从 没有 经 验 的 工人 
[人 一 共有 10 个 , 因此 雇 / 
210 种 方法 . 在 这 个 例子 中 , 选 出 6 个 人 的 每 一 种 方法 
因此 , 选 出 的 员工 都 没有 工作 经 验 的 概率 就 等 于 选 出 6 


] 6 名 没有 


个 没有 工作 经 验 的 员工 的 方法 数 除 以 可 能 选择 的 总 数 . 我 们 已 经 知道 这 2 个 值 是 


多 少 , 所 以 通过 快速 计算 得 到 : 选 出 的 员工 都 没有 工作 经 验 的 概率 是 #0 
或 约 等 于 0.54%. 


我 们 还 有 最 后 


问题 5.1.1 ”假设 学 生 会 里 有 12 个 人 . 


e@ 从 中 选 出 4 个 人 , 有 多 少 种 选 法 ? 


了 
1292 


个 问题 . 这 道 题 的 目的 是 强调 次 序 何 时 重要 , 何 时 不 重要 . 


e@ 如 果 没 人 可 以 担任 两 种 职务 , 那么 从 这 些 人 中 选 出 一 名 主席 、 一 名 副 主席 、 
一 名 财务 主管 和 一 名 秘书 有 多 少 种 选 法 ? 
。 如 果 每 个 人 都 可 以 担任 多 个 职务 , 那么 从 中 选 出 一 名 主席 、 一 名 副 主 席 、 一 


名 财务 主管 和 一 名 秘书 有 多 少 种 选 法 ? 
个 问题 的 答案 是 (了) = 495, 因 


解答 : 第 


为 所 有 人 都 是 平等 的 , 我 们 只 需要 
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从 12 个 人 中 无 次 序 地 挑选 出 4 个 人 就 行 了 . 第 二 个 问题 的 答案 是 12 .11.10.9= 
12!/8! = 11 880, 因为 现在 要 考虑 次 序 了 (主席 有 12 种 选 法 , 副 主席 有 11 种 选 
法 , 等 等 ， 记 住 , 谁 是 主席 、 谁 是 副 主 席 等 是 很 重要 的 )， 最 后 一 个 问题 的 答案 是 
12.12.12.12=124= 20 736. 现在 每 个 人 都 可 以 担任 多 个 职务 ; 与 之 前 的 问题 不 
同 , 选 定 了 担任 主席 的 人 并 不 会 减少 其 他 职务 的 候选 人 数量 . 现在 始终 有 12 个 人 
参 选 . 不 难看 出 , 根据 我 们 对 从 12 个 人 中 选 出 4 个 人 的 不 同 理解 , 一 共有 3 种 可 能 
的 结果 ! 这 进一步 强调 了 清晰 陈述 问题 的 重要 性 . 这 种 “从 12 个 候选 者 中 选 出 4 
个 人 有 多 少 种 方法 ”的 问 法 是 不 准确 的 , 你 需要 具体 说 明 次 序 是 否 重要 , 以 及 一 个 
人 是 否 可 以 多 次 参 选 . 


5.1.3 ”循环 次 序 


我 们 已 经 讨论 了 很 多 问题 , 其 中 需要 担心 是 有 序 选取 还 是 无 序 选 取 . 下 面 的 问 
题 是 这 两 种 情况 的 折 中 . 我 们 为 什么 要 走 极端 呢 ? 有 没有 这 样 的 情况 : 有 时 可 以 考 
虑 次 序 , 但 有 时 也 可 以 不 考虑 呢 ? 有 , 我 们 已 经 见 过 一 个 这 样 的 例子 : 3.4.1 节 关 于 
井 字 游戏 的 问题 . 如 果 考 虑 棋盘 次 序 , 那么 9 个 方 格 中 的 每 个 都 与 其 他 方 格 不 同 ， 
这 样 第 一 步 就 有 9 种 可 能 的 选择 . 但 是 , 如 果 人 允许 旋转 和 翻转 , 那么 第 一 步 只 有 3 
种 不 同 的 走 法 . 这 对 我 们 分 析 游 戏 会 有 很 大 帮助 . 沿 着 这 种 思路 , 我 们 来 看 另 一 个 
例子 . 

例 5.1.2 考虑 以 下 相关 问题 . 

(1) 5 个 人 依次 排 成 一 列 , 有 多 少 种 排 法 ? 

(2) 5 个 人 围 坐 在 一 张 圆桌 专 , 有 多 少 种 坐 法 ? 这 里 的 关键 是 相对 次 序 . 换 身 
话说 , 假设 桌子 的 半径 是 单位 长 度 1; 我 们 先 确定 坐 在 (1,0) 位 置 的 人 ， 
然后 按照 逆 时 针 方 向 确定 所 有 人 的 位 置 . 我 们 认为 , Alice、Bob、Eve、 
Charlie、Dan 的 排序 方式 与 Eve、Charlie、Dan、Alice、Bob 的 排序 方式 
是 一 样 的 . 

(1) 因为 次 序 在 第 一 个 问题 中 很 关键 , 所 以 每 个 人 的 位 置 都 很 重要 . 我 们 可 以 
把 5 个 人 中 的 任何 一 个 排 在 第 一 位 . 对 于 第 二 个 位 置 , 只 剩 下 了 4 个 候选 人 , 所 以 
这 个 位 置 只 有 4 种 选 法 . 按照 这 种 逻辑 , 我 们 可 以 看 到 第 三 、 第 四 和 第 五 个 位 置 分 
别 有 3 种 、2 种 和 1 种 可 能 的 选 法 . 让 这 些 数 字 相 乘 , 得 到 的 乘积 就 是 这 5 个 人 依 
次 排 成 一 列 的 方法 总 数 : 5x 4x3x2x1=5!= 120. 

(2) 在 第 二 个 问题 中 , 假设 这 5 个 人 围 坐 在 一 张 圆 桌 旁 . 现在 已 经 没有 “第 
个 ”位 置 和 “最 后 一 个 ”位 置 的 说 法 . 当 我 们 旋转 桌 椅 时 , 他 们 的 相对 次 序 不 会 发 生 
改变 . 同样 地 , 我 们 也 可 以 选 定 一 个 特殊 的 人 , 通过 旋转 把 他 固定 在 (1,0) 位 置 上 . 
很 明显 , 这 是 循环 排序 问题 . 

在 选 定 了 这 个 人 之 后 , 我 们 可 以 用 线性 列表 来 描述 这 个 循环 问题 ; 这 个 列表 是 


人 
| 


Wa 
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一 种 巧妙 的 方法 , 它 可 以 把 问题 改写 成 更 简单 的 形式 . 为 了 找 出 围 坐 在 桌子 旁 的 所 
有 方法 , 我 们 只 需要 求 出 4 个 人 排 成 一 列 的 方法 总 数 就 行 了 , 现在 就 要 考虑 第 一 个 


位 置 和 最 后 一 个 位 置 了 . 这 个 被 选 定 的 特殊 的 人 是 排 在 第 一 位 、 最 后 一 位 , 还 是 其 


他 某 个 位 置 并 不 重要 . 重要 的 是 , 对 于 任意 一 种 排列 方法 , 我 们 总 是 可 以 通过 旋转 


把 这 个 特殊 的 人 放 在 某 个 特定 的 位 置 上 , 这 可 以 让 我 们 少 考虑 一 个 人 , 但 现在 就 要 


开始 留 


I 


意 次 序 了 . 根据 这 个 例子 的 第 (1) 部 分 , 我 们 可 以 求 出 剩 下 的 4 个 人 依次 排 


方法 有 


24 


成 一 列 有 4! = 24 种 方法 . 因此 , 不 难看 出 , 这 5 个 人 有 序 地 围 坐 在 一 张 圆 桌 旁 的 


种 . 


一 般 来 说 , n 个 人 有 序 地 围 坐 在 一 张 圆桌 旁 有 (n 一 1)! 种 不 同 的 坐 法 . 值得 注 


意 的 是 , 人 们 围 坐 在 桌子 旁 的 方法 数 要 比 排 成 一 列 的 方法 数 少 , 这 是 有 道理 的 : 在 


线性 排列 中 , 第 一 个 人 挪 到 最 后 一 个 位 置 上 、 其 他 人 都 向 前 移动 一 个 位 置 将 会 产生 


一 个 新 的 排序 ; 但 当 围 坐 在 桌子 旁 时 , 这 就 相当 于 每 个 人 都 围 着 桌子 旋转 了 一 个 位 


置 , 并 不 会 导致 新 的 排序 


过 了 


:有 一 个 与 围 坐 在 桌子 劳 有 关 的 问题 , 即 康 威 的 餐巾 问题 . 它 引 自 于 Clae- 


sson 和 Petersen 的 有 趣 论 文 Conway’”” Napkin Problem. “mn 个 男人 围 坐 在 一 张 特 


定 的 圆桌 劳 . 加 上 有 mn 张 餐巾 , 每 两 人 之 间 恰 有 一 张 . 因为 他 们 既是 男人 又 是 数学 
家 , 所 以 认为 他 们 不 懂 餐 桌 礼仪 . 这 些 人 随机 地 依次 坐 在 桌子 前 . 对 每 个 客人 来 说 ， 


当 他 坐 下 后 , 使 用 左 侧 餐 巾 的 概率 是 p, 而 使 用 右 侧 餐 巾 的 概率 是 g = 1 一 p. 如果 


左右 两 侧 都 有 餐巾, 他 就 可 以 随意 地 选择 一 张 餐巾 . 如 果 只 有 一 侧 有 和 餐巾 , 他 将 会 
使 用 这 张 餐 巾 (尽管 这 可 能 不 是 他 想 要 的 餐巾 ). 第 三 种 可 能 性 是 没有 餐巾 可 用 , 这 
位 不 幸 的 客人 将 面临 整个 晚宴 都 没有 任何 餐巾 可 用 的 局 面 !” 我 们 有 许多 问题 要 问 


( 且 需 要 回答 ). 例如 , 预计 有 多 少 人 会 得 到 餐巾, 以 及 每 个 人 都 可 以 得 到 餐巾 的 概率 


是 多 少 . 


与 餐巾 问题 类 似 的 是 计算 机 科学 领域 的 迪 杰 斯 特 拉 的 哲学 家 聚餐 问题 . 基本 
的 想法 是 , 有 ”个 人 围 坐 在 一 张 圆桌 旁 , 每 两 人 之 间 有 一 根 簧 子 . 每 个 人 都 可 以 拿 
走 自己 左 侧 和 右 侧 的 简 子 , 但 必须 要 拿 到 两 根 筷子 后 才能 吃 东 西 . 当 有 人 就 餐 完毕 ， 


他 们 就 要 


巴 筷 子 放 下 . 这 是 个 很 重要 的 问题 , 因为 筷子 代表 计算 机 的 关键 资源 , 而 


哲学 家 代表 不 同 的 运行 过 程 . 这 里 有 一 些 显 而 易 见 的 问题 , 比如 预计 有 多 少 人 可 以 


吃 东 西 


, 所 有 人 都 吃 不 了 东西 的 概率 是 多 少 , 以 及 如 何 通过 改变 问题 的 约束 条 件 来 
改变 结果 . 显然 , 如 果 每 个 人 都 总 是 先 拿 起 右 侧 的 筷子 , 那么 所 有 人 都 吃 不 上 饭 , 这 
意味 着 你 的 电脑 会 停止 运行 . 我 们 可 以 修改 这 个 问题 , 并 探讨 当先 拿 起 某 根 给 定 身 
子 的 概率 发 生变 动 时 , 所 有 人 都 吃 不 了 饭 的 概率 是 如 何 随 之 变动 的 . 这 个 问题 与 围 


坐 在 虹 子 劳 的 题目 有 关 , 但 它 还 与 一 个 观点 有 关 , 即 如 果 改 变 一 个 问题 的 解释 , 那 
么 其 结果 也 会 发 生 改 变 . 这 也 是 现实 问题 的 一 个 例子 , 我 们 可 以 运用 这 些 概 念 来 更 


好 地 理 


解 1 


E 在 发 生 的 事情 
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桌子 问题 的 另 一 个 例子 是 亚瑟王 和 他 的 圆桌 . 你 可 以 算出 安排 亚瑟王 骑士 的 座 
位 有 多 少 种 方法 , 并 求 出 某 个 指定 的 骑士 坐 在 亚瑟王 旁边 的 概率 是 多 少 , 这 是 一 件 
值得 期 待 的 事 . 你 也 可 以 想象 , 亚瑟王 可 能 不 希望 他 的 妻子 格 温 娜 维尔 坐 在 兰 斯 洛 
特 旁 边 , 所 以 可 以 算 一 下 , 如 果 兰 斯 洛 特 不 能 坐 在 格 温 娜 维尔 的 旁边 , 那么 排列 骑 
士 的 方法 有 多 少 种 .你 还 可 以 让 这 个 问题 进一步 复杂 化 : 现在 兰 斯 洛 特 希望 能 坐 
在 格 温 娜 维尔 的 对 面 , 这 样 他 们 就 能 秘密 地 交换 眼神 , 此 时 可 能 的 排列 数 就 会 减少 . 
你 还 可 以 假设 , 更 重要 的 人 通常 会 坐 在 亚瑟王 的 旁边 , 所 以 一 个 指定 的 骑士 坐 在 亚 
登 旁 边 的 概率 是 p, 你 也 可 以 算出 任何 给 定 排列 的 概率 . 这 看 起 来 像 是 个 充 雇 的 例 
子 , 我 们 没 必要 算出 实际 值 , 而 是 看 看 这 些 概念 是 如 何 出 现在 现实 世界 中 的 ,以 及 
学 习 这 些 方法 如 何 帮助 你 理解 不 同 的 问题 . 正如 我 们 所 看 到 的 , 与 围 坐 在 桌 旁 有 关 
的 问题 非常 多 . 


5.1.4 选择 套装 


即使 你 不 关心 时 尚 (因为 本 书 是 为 学 习 数 学 的 人 而 写 的 , 这 一 点 错 不 了 ! ), 下 
一 个 问题 也 非常 重要 . 不 要 跳 过 这 部 分 内 容 一 一 它 能 帮助 我 们 更 好 地 学 习 概率 论 
中 两 个 (而 非 一 个 ) 最 重要 的 观点 ! 

问题 5.1.3 ”你 正在 穿 衣服 , 有 5 双 不 同 的 袜子 、3 条 不 同 的 裤子 和 4 件 不 同 
的 衬衫 可 供 选择 . 假设 恰好 有 2 双 袜 子 是 红色 的 , 所 有 裤子 都 不 是 红色 的 , 而 且 只 
有 1 件 红 色 的 衬衫 . 现在 你 必须 选择 1 双 袜 子 、1 条 裤子 和 1 件 衬衫 . (1) 你 有 多 
少 种 不 同 的 套装 组 合 ? (2) 今天 是 学 校 的 “自豪 日 ”, 并 且 学 校 的 主 色调 是 红色 ; 那 
么 , 至 少 有 1 件 红色 衣物 的 套装 组 合 有 多 少 种 ? 

(1) 如 果 有 1 双 不 同 的 袜子 、1 条 不 同 的 裤子 , 或 者 1 件 不 同 的 衬衫 , 那么 这 2 
套 衣服 就 是 不 一 样 的 . 为 了 求 出 不 同 套 装 的 总 数 , 我 们 想 弄 清楚 搭配 1 双 袜 子 、1 
条 裤子 和 1 件 衬衫 有 多 少 种 不 同 的 方法 . 因为 有 5 双 袜 子 、3 条 裤子 和 4 件 衬衫 ， 
所 以 通过 简单 地 计算 5 x 3 x 4= 60, 我 们 可 以 看 出 一 共有 60 种 不 同 的 套装 . 

(2) 使 套装 中 包含 1 件 红色 衣物 的 方法 有 2 种 : 这 套 衣服 可 以 包含 1 双 红 袜 
子 , 或 者 包含 1 件 红 衬衫 (或 者 同时 包含 两 者 ). 为 了 计算 包含 1 件 红色 衣物 的 套装 
有 多 少 种 , 我 们 首先 要 算 只 包含 1 双 红 色 的 袜子 套装 有 多 少 种 . 为 了 搭配 包含 一 双 
红色 袜子 的 套装 , 我 们 必须 从 2 双 红 色 袜 子 中 选 出 1 双 , 而 且 还 要 任 选 出 1 件 衬衫 
和 1 条 裤子 . 现在 我 们 有 2 双 袜 子 、3 条 裤子 和 4 件 衬衫 可 供 选 择 , 也 就 是 说 , 包 
含 1 双 红 色 袜 子 的 套装 总 共有 2 x 3 x 4 = 24 种. 同样 , 当 只 有 1 件 红色 衬衫 时 , 我 
们 有 5 双 袜 子 、3 条 裤子 和 1 件 衬衫 可 以 选择 . 因此 , 包含 1 件 红 色 衬 衫 的 套装 有 
5x3x1=15 种 . 

人 们 可 能 会 轻易 地 认为 , 接 下 来 要 做 的 就 是 把 包含 1 件 红 色 衬 衫 的 套装 数 与 
包含 1 双 红 色 袜 子 的 套装 数 加 起 来 就 行 了 , 但 现在 还 为 时 过 早 . 我 们 要 考虑 同时 包 
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1 件 红 衬衫 和 1 双 红 袜子 的 套装 . 这 种 套装 被 计算 了 两 次 : 第 一 次 出 现在 计算 
红色 袜子 的 套装 数 时 (我 们 没有 说 衬衫 不 能 是 红色 的 ), 第 二 次 出 现在 计算 包 
衬衫 的 套装 数 时 (同样 , 我 们 并 没有 说 袜子 不 能 是 红色 的 ). 因此 , 我 们 必须 

出 既 包含 1 双 红 色 袜 子 又 包含 1 件 红色 衬衫 的 套装 数 , 然后 把 它 从 套装 总 数 中 
减 去 , 从 而 保证 这 种 情况 只 计算 了 一 次 . 

我 们 只 有 2 双 红 色 的 袜子 和 1 件 红色 的 衬衫 . 因此 , 为 了 搭配 同时 包含 1 件 
红色 衬衫 和 1 双 红 色 袜 子 的 套装 , 现在 我 们 有 2 双 袜 子 、3 条 裤子 和 1 件 衬衫 可 供 
选择 . 于 是 , 同时 包含 红色 袜子 和 红色 衬衫 的 套装 有 2 x3x1=6 种 . 

现在 我 们 已 经 做 好 了 准备 , 看 看 至 少 包含 1 件 红 色 衣 物 的 套装 有 多 少 种 : 我 们 
把 包含 1 双 红 色 袜 子 的 套装 数 与 包含 1 件 红色 衬衫 的 套装 数 加 起 来 , 然后 再 减 去 
同时 包含 了 红色 袜子 和 红色 衬衫 的 套装 数 . 这 样 就 得 到 了 至 少 包 含 1 件 红 色 衣 物 
的 套装 有 24 十 15 一 6 = 33 种 . 从 前 面 的 结果 中 可 以 看 出 , 我 们 一 共有 60 种 可 能 的 
套装 . 如 果 每 件 套装 都 等 可 能 地 被 选中 , 那么 随机 搭配 的 1 套 衣服 中 至 少 包 含 1 件 
红色 衣服 的 概率 是 33/60 = 11/20, 或 为 55%. 

这 种 先 求 出 包含 1 种 红色 衣物 的 套装 数 , 然后 减 去 同时 包含 2 种 红色 衣物 的 
套装 数 的 方法 用 到 了 所 谓 的 容 斥 原理 . 这 是 种 强大 的 技巧 , 常 被 用 来 简化 那些 令 人 
头疼 的 计数 . 我 们 会 在 5.2 节 展 开 详 细 讨 论 . 它 所 做 的 是 把 一 个 非常 困难 的 计算 分 
解 成 许多 简单 的 计算 , 但 接 下 来 就 要 求 我 们 把 这 些 简单 问题 的 答案 组 合 起 来 , 从 而 
得 到 原始 问题 的 解 . 一 般 来 说 , 解答 大 量 的 简单 问题 要 比 解 决 一 个 难题 好 得 多 . 

另外 , 我 们 还 有 一 种 解决 这 个 问题 的 好 方法 . 对 于 每 一 种 套装 来 说 , 它 要 么 包 
含 红 色 的 衣物 , 要 么 不 包含 红色 的 衣物 . 如 果 我 们 知道 可 能 的 套装 总 数 和 不 包含 红 
色 衣 物 的 套装 数 , 那么 通过 做 减法 就 能 求 出 包含 红色 衣物 的 套装 数 . 根据 前 面 的 结 
果 , 我 们 已 经 知道 一 共有 60 种 不 同 的 套装 . 现在 只 需要 求 出 不 包含 红色 衣物 的 套 
装 有 多 少 种 就 行 了 . 为 此 , 我 们 只 能 从 部 分 衣物 中 挑选 . 现在 只 有 3 双 非 红色 的 袜 
子 、3 条 裤子 和 3 件 非 红 色 的 衬衫 可 以 选择 . 这 告诉 我 们 , 不 包含 红色 衣服 的 套装 
有 3x3x3= 27 种 . 因为 一 共有 60 种 可 能 的 套装 , 所 以 至 少 包含 1 件 红色 衣物 
的 套装 一 定 有 60 - 27 = 33 种 . 幸运 的 是 , 这 也 是 我 们 使 用 第 一 个 方法 所 得 到 的 
结果 . 


我 们 还 可 以 从 中 提取 出 通用 的 技巧 . 


对 立 事 件 : 在 很 多 问题 中 , 要 想 求 出 4 的 概率 , 最 简单 的 方法 就 是 求 出 4 不 发 
生 的 概率 , 因为 Pr(4) = 1 一 Pr(4°). 这 在 解决 “至 少 一 个 ”的 问题 上 是 非常 有 用 
的 , 因为 它 的 对 立 事件 就 是 什么 都 没有 发 生 . 


对 大 学 生来 说 , 这 个 问题 有 一 个 有 趣 的 应 用 : 假设 你 的 衣柜 里 有 n 件 衬衫 、m 
条 裤子 和 双 袜 子 , 并 且 同 一 套 衣服 最 多 只 能 穿 一 次 , 那么 在 你 必须 洗衣 服 之 前 ， 
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这 些 衣服 可 以 穿 几 天 . 为 了 更 加 贴近 现实 , 你 可 以 允许 同 1 条 裤子 多 穿 儿 次 , 而 且 
要 避免 某 些 特定 的 颜色 组 合 . 这 是 大 学 生 们 想 解 决 的 最 重要 问题 之 一 . 在 现实 生活 
中 , 情况 要 复杂 得 多 , 因为 有 些 衬 衫 无 法 搭配 条 些 裤 子 , 有 时 你 也 不 需要 和 穿 袜子 . 此 
外 , 还 有 更 多 衣物 可 以 考虑 , 而 且 要 顾及 天 气 因素 . 但 是 不 难 想象 , 利用 同样 的 技巧 ， 
我 们 至 少 可 以 估算 出 一 个 结果 . 

总 之 , 通过 这 个 简单 的 时 尚 问题 , 我 们 得 到 了 概率 论 中 两 个 重要 而 强大 的 技巧 : 
容 斥 方法 和 对 立 事 件 方法 . 在 罕 衣 搭配 方面 , 这 是 个 相当 不 错 的 回报 ! 


5.2 容 斥 方法 


在 第 3 章 中 , 我 们 研究 了 阶乘 函数 和 二 项 式 系数 的 一 些 性 质 , 并 看 到 了 它们 在 
解决 概率 问题 时 的 作用 . 不 笠 的 是 , 对 于 一 些 复杂 的 问题 , 想 要 找到 一 种 好 的 计数 
方法 使 得 所 有 情况 都 能 被 考虑 到 、 又 不 会 导致 重复 计数 , 真 的 非常 难 . 容 斥 方法 (或 
者 容 斥 原理 ) 就 是 为 了 避免 出 现 这 些 问 题 而 设计 的 , 而 且 它 的 代数 运算 会 更 加 简单 . 
这 是 一 个 不 平凡 的 目标 , 也 是 一 个 重要 的 目标 . 如 果 能 简化 代数 运算 , 那么 你 就 可 
以 看 到 一 些 之 前 可 能 没有 注意 到 的 规律 . 

关于 简化 代数 运算 , 下 面 是 我 最 喜欢 的 例子 之 一 . 假设 有 人 让 你 把 下 列 各 项 加 
起 来 


51—47 

于 132— 51 

平 611 — 132 

十 891 — 611 

+ 1234— 891 

+ 2013 - 1234. 

当然 , 一 种 方法 是 算出 第 一 个 差 为 4 第 二 个 差 是 81, 接 下 来 的 差 是 479, 依 此 类 推 ， 

然后 把 所 有 结果 相 加 . 更 好 的 方法 是 留意 到 这 是 一 个 伸缩 和 . 51 出 现 了 两 次 (一 次 

带 正 号 , 一 次 带 负 号 ), 所 以 51 被 抵消 掉 了 .类似 地 , 出 现 了 两 次 的 132 也 被 抵消 

掉 了 , 依 此 类 推 , 直到 最 后 剩 下 了 2013 一 47, 即 1966. 注意 , 第 二 种 方法 要 简单 得 

多 通过 巧妙 地 安排 代数 运算 , 问题 解决 起 来 就 更 加 轻松 了 . 
首先 , 我 们 要 陈述 容 斥 原理 的 内 容 , 然后 描述 它 为 什么 起 作用 , 并 且 研 究 很 多 

例子 . 


5.2.1 ” 容 斥 原理 的 特例 


在 全 面 阐述 容 斥 原理 之 前 , 我 们 先 来 看 一 些 特 殊 的 情况 , 了 解 容 斥 原理 是 什么 
以 及 它 为 什么 会 如 此 有 用 . 对 于 一 组 给 定 的 集合 , 我 们 有 两 种 自然 运算 : 并 和 交 . 
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当 我 们 想 要 讨论 至 少 有 一 个 事件 发 生 的 概率 时 , 会 使 用 并 运算 ; 如 果 想 求 出 所 有 事 
件 同 时 发 生 的 概率 , 我 们 就 会 使 用 交 运 算 . 通常 情况 下 , 计算 “所 有 事件 同时 发 生 的 
概率 ”要 比 计 算 “ 至 少 有 一 个 事件 发 生 的 概率 ”容易 得 多 . 例如 , 回想 一 下 我 们 对 
完美 牌 局 的 讨论 . 计算 固定 数量 的 人 都 拿 到 了 一 手 同 花 色 牌 的 概率 并 不 很 难 , 但 至 
少 有 一 个 人 拿 到 一 手 同 花色 牌 的 概率 就 会 非常 复杂 . 

注 5.2.1 在 涉及 容 斥 原理 的 很 多 问题 中 , 一 个 集合 的 概率 就 是 该 集合 所 包 
含 的 元 素 个 数 除 以 空间 中 元 素 的 总 数 . 为 了 强调 这 种 特殊 情形 , 我 们 有 时 会 把 一 个 
集合 的 元 素 个 数 记 作 |A|, 而 不 是 Pr(4); 但 是 , 更 一 般 的 情况 是 , 不 同 元 素 的 概率 
是 不 一 样 的 . 如 果 想 要 得 到 最 一 般 的 公式 , 你 就 应 该 使 用 集合 的 概率 而 不 是 集合 的 

容 斥 原理 采用 的 方法 是 用 交 的 概率 表示 并 的 概率 , 其 中 包含 了 大 量 的 交 . 这 是 
解决 许多 简单 问题 而 不 是 一 个 困难 问题 的 另 一 个 例子 . 这 里 的 思路 是 , 用 交 的 概率 
和 与 差 来 表示 并 的 概率 . 

在 两 个 集合 的 并 的 概率 公式 中 , 我 们 已 经 看 到 了 这 样 的 例子 : 

Pr(AUB)= Pr(A)+Pr(B)— Pr(ANB). 
我 们 把 它 改写 成 更 一 般 的 形式 . 把 4 和 B 分 别 替 换 成 集合 41 和 42z, 于 是 有 
Pr(Ai U A,) 一 Pr(Ai) 十 Pr(42>) Pr(41 [a A,) 


= _Pr(Ai)— > Pr(AiN 4;). 


1<i<j<2 
蜂 然 等 号 右 端 的 最 后 一 个 表达 式 看 起 来 相当 烦琐 (尤其 是 要 把 最 后 的 和 看 作 
项 ! ), 但 它 说 明了 该 如 何 推广 这 个 公式 . 我 们 已 经 解释 过 这 个 式 子 为 什么 成 立 ， 
现在 继续 看 一 下 关于 三 个 集合 的 公式 , 并 对 其 为 何 成 立 展开 讨论 ; 
Pr(Ai1U 42U43) = Pr(41) 十 Pr(42) 十 Pr(43) 一 Pr( 4 mn42) 
— Pr(A1N As)— Pr(A2N As)+ Pr(AiN A nN A;), 


也 可 以 写成 
3 


Pr(41 U 42 U 43) 一 >》， Pr( A;) > >》， Pr(A; NN A;) 
7 1&i<j<3 
+ >》 Pr(AiNA;NA;) 
1<&i<j<k<3 
3 
= _ Pr(Ai)— >》 Pr(AiN hi,) 
i1=1 1<il<i2<3 


1<il<io<is<3 
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虽然 最 后 一 行 的 符号 乍 看 起 来 像 场 亚 梦 , 但 它 实 际 上 是 一 种 不 错 的 选择 , 并 且 


会 让 后 面 的 事情 变 得 更 加 简单 . 这 里 的 符号 与 多 元 微 积 分 中 的 符号 非常 相似 . 如 果 
考察 的 是 二 维 或 三 维 空间 , 那么 我 们 常用 z,m > 来 表示 变量 , 并 用 世 广 及 来 表示 方 
向 ; 但 是 , 现在 有 任意 多 个 方向 , 所 以 用 不 同 的 字母 来 表示 就 行 不 通 了 . 在 这 种 情 
… ,的 来 分 别 表示 变量 和 方向 . 这 里 采用 了 类 


况 下 ， 我 们 要 使 用 Tl ,Tn 和 61,: 
似 的 方法 , 使 用 了 融 有 下 标的 i 


图 5-1 演示 了 三 个 集合 的 情形 . 我 们 要 做 的 是 计算 并 集 41 U 42U 4s 中 有 多 
少 个 元 素 , 记 作 |41U 42 U 4s|. 如 果 这 些 集合 是 互 不 相交 的 , 我 们 只 需要 把 它们 的 


元 素 个 数 加 起 来 : Ail 十 |42| 十 14sl. 


` 焉 的 是 , 如 果 它 们 有 相同 的 元 素 , 那么 我 们 


就 做 了 重复 计算 . 记 住 , 重复 计算 是 概率 论 中 最 大 的 危险 之 一 . 注意 , 同时 包含 在 两 
个 集合 中 的 每 个 元 素 都 被 计算 了 两 次 . 例如 , 对 于 任意 的 ze A1 nn 42, 我 们 在 |41| 


中 计算 了 一 次 zx, 又 在 |42| 中 计算 了 一 次 zx. 因此 , 需要 减 去 |41n 4z|; 同样 , 也 要 


减 去 |41n 4s| 和 |42 mn 4s|. 现在 , 我 们 没有 重复 计算 恰好 包含 在 两 个 集合 中 的 元 


素 , 这 些 元 素 都 只 被 计算 了 一 次 . 


图 5-1 三 个 集合 的 容 斥 原理 


不 幸 的 是 , 计数 略 有 下 降 . 我 们 已 经 正确 地 处 理 了 恰好 包含 在 一 个 集合 和 恰好 


包含 在 两 个 集合 中 的 元 素 , 而 那些 同 


时 包含 在 三 个 集合 中 的 元 素 却 没有 被 计算 在 


内 . 出 现 这 种 状况 的 原因 是 , 在 计算 |41|、|42| 和 |43| 时 , 我 们 把 这 些 元 素 计算 了 
三 次 , 但 又 在 考察 |4A1n 4s|、|A1n hs| 和 |Az mn As| 时 把 它们 减 掉 了 三 次 . 解决 这 
个 问题 的 方案 很 清楚 : 要 把 它们 添加 回去 , 必须 要 加 上 |Ain 42m 43|. 现在 每 个 元 


素 的 计数 都 是 正确 的 ; 对 于 任意 一 个 


则 , 被 计算 了 0 次 . 于 是 
[A1U AsU 4a| 


元 素 , 如 果 属 于 并 集 , 那么 被 计算 了 一 次 ; 否 


3 
= Ma- > Man4al+ >》 |4inNAin hl, 


人 li 尺 记 全 3 


1<il<i2o<is<3 


或 者 更 一 般 地 , 如 果 每 个 元 素 的 概率 不 一 定 相等 , 那么 : 
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3 
Pr(41 U 42 U 43) Ss > Pr(Ai,) 3 > Pr(Ai; NN Ai,) 
i1=1 1<il<i2<3 
1&il<i2<is&3 


注 5.2.2 ”在 上 述 分 析 中 , 我 们 很 难 忽略 关于 集合 下 标的 条 件 . 例如 , 对 于 两 
个 集合 的 交 , 我 们 没有 说 和 ji 的 取 值 都 介 于 1 和 3 之 间 , 而 是 给 出 了 1<< 计 < 
izo < 3. 原因 是 必须 避免 对 集合 的 重复 计算 , 因为 4imn4s 和 4smn4i 是 一 样 的 . 把 
全 部 有 效 序 对 都 列 出 来 , 我 们 看 到 

(i1,i2) € {(1,2), (1,3), (2, 3)}. 
现在 可 能 看 不 出 其 中 的 规律 , 我 们 来 考察 1 << 计 j < 记过 4. 此 时 有 
(i1,1i2) € {(1,2), (1,3), (1, 4), (2,3), (2, 4), (3, 4)}, 

但 如 果 1 过 计 <io 志 5, 那么 

(i1,1i2) € {(1,2),(1,3), (1,4), (1, 5), (2,3), (2, 4), (2, 5), (3, 4), (3, 5), (4, 5)}. 
当 最 大 值 为 3 时 有 3 个 序 对 , 当 最 大 值 为 4 时 有 6 个 序 对 , 当 最 大 值 为 5 时 我 们 得 
到 了 10 个 序 对 . 收集 数据 是 形成 直观 认识 的 好 方法 ; 如 果 你 还 没有 看 出 规律 , 那 
就 多 考察 一 些 数据 . 我 们 能 看 出 这 里 的 一 致 性 , 当 1 < 计 < 记过 nn 时 共有 (2 个 序 
对 . 回顾 一 下 二 项 式 系数 的 定义 , 这 是 很 合理 的 : 我 们 需要 从 {1,2,… ,n} 中 选 出 
两 个 不 同 的 下 标 . 虽然 它们 的 次 序 无 关 紧 要 , 但 为 了 准确 地 写 出 表达 式 , 我们 把 较 
小 的 下 标记 作 条, 把 较 大 的 记 作 io. 这 种 规律 还 在 继续 , 当 1< 计 <ic<isa<n 时 
共有 (%) 个 三 元 组 . 这 一 观察 结果 非常 有 价值 , 因为 在 许多 情况 下 , 交集 数 相同 的 
事件 出 现 的 次 数 也 是 相同 的 ; 因此 , 我 们 只 需要 算出 其 中 的 一 个 , 然后 再 来 上 一 个 
适当 的 二 项 式 系数 即 可 . 
5.2.2 ” 容 斥 原理 的 陈述 


现在 我 们 来 陈述 一 般 的 容 斥 公式 , 并 把 它 的 证 明 留 到 5.2.3 节 . 注意 , 这 是 由 三 
个 集合 的 并 的 公式 自然 地 推广 而 来 的 . 
容 斥 原理 : 考虑 集合 41, 42,… , A. 用 |S| 来 表示 集合 8 的 元 素 个 数 , 并 把 5 
的 概率 记 作 Pr(S). 于 是 


U4=>2 44- > ln4l+ > ndin4 
2 i=1 


1te 1l1<&i<j<k<n 


二 >》， [An na4 nn 


1<&l1<l2<…<in_1&n 
+ (—1)” AiN As NN A,l; 
如 果 把 上 述 集合 的 大 小 全 都 换 成 它们 的 概率 , 这 个 式 子 同样 成 立 . 


1| 
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我 们 可 以 写 得 更 简洁 一 些 . 设 hw = hn nn Awnn…n hi( 因 此 412 = 
41imn42 且 hsg9 = 44n4sn49), 于 是 


U4 
i=1 


n 


=》 14i|- >》， |Aij| 十 >》, |Aijx| 一 … 


i=1 1<iZj<n 1<i<j<kgn 
十 (一 >》， [A | 十 (一 1 一 1 4312. 

1<0 <12<…<1n 1<n 
如 果 4; 均 为 有 限 集 , 并 且 我 们 使 用 的 计数 度量 以 结果 空间 中 每 个 元 素 都 是 等 可 
能 的 为 基础 , 那么 可 以 把 上 面 所 有 的 |S| 都 替换 成 Pr(5). 


这 是 个 很 长 的 公式 , 让 我 们 花 儿 分 钟 来 分 析 一 下 ， 左 侧 只 有 一 项 , 即 Uz 4;. 
这 个 事件 表示 至 少 有 一 个 A; 发 生 . 右 侧 表示 的 是 什么 事件 呢 ? 4;n_4i = 4i7 表示 
事件 A; 和 事件 A; 同时 发 生 . 同样 地 , 4 n 4in Ax = 4 六 表示 4、 4 和 Aj 这 
三 个 事件 全 都 发 生 . 因此 , 容 斥 原理 的 要 点 是 将 事件 的 并 简化 成 交 的 组 合 . 虽然 右 
侧 的 项 更 多 , 但 通常 情况 下 , 交 比 并 更 容易 计算 . 

对 于 只 有 两 个 事件 的 简单 情形 , 我 们 已 经 看 到 了 容 斥 公式 的 证 明 : Pr(AUB) 
Pr(4)+Pr(B) 一 Pr(4NB). 如 果 4n 是 空 集 , 那么 右 侧 最 后 一 项 就 不 会 发 生 ， 
少 有 一 个 事件 发 生 的 概率 就 是 4 和 B 的 概率 之 和 ; 但 是 , 如 果 交 集 是 非 空 的 , 寻 
么 去 掉 右 侧 最 后 一 项 就 意味 着 进行 了 重复 计算 . 

我 们 快速 浏览 一 个 例子 . 想象 一 下 , 括 出 两 颗 仍 子 (每 颗 山 子 的 点 数 都 是 1、2、 
3、4、5 和 6), 我 们 想 知道 掷 出 点 数 1 的 结果 有 和 多少 种 . 让 A1 表示 第 一 颗 咒 子 的 点 
数 是 1, 让 4。 表示 第 二 颗 仍 子 的 点 数 是 1. 我 们 想 求 出 |41U42|. 下 面 来 找 出 不 同 的 
量 . 首先 , 因为 4 = {(1,1),(1,2), (1,3),(1, 仿 , (1,5), (1,6)}, 所 以 |41| = 6. 同样 地 ， 
由 42 = {(1,1),(2,1),(3,1), (4,1),(5,1),(6,1)} 可 知 |42| = 6, 并 且 由 41s = {(1,1)} 
可 知 |41n 42| = |412| = 1. 把 上 述 结果 综合 起 来 , 我 们 有 
[41U A2|=|Ai|+|A42| -1412|=6+6—1=11, 

掷 出 点 数 1 的 结果 恰好 有 11 种 . 如 果 考 察 概 率 的 话 , 那么 Pr(41) = Pr(42) = 1/6， 
Pr(A12) = 1/36, 并 
Pr(41U 42) = Pr(41) 十 Pr(42) — Pr(Ai2) = < 十 


时 1 


HH 


wy 


1 1 3 
6 36 36- 


等 可 能 集合 的 容 斥 原理 : 在 涉及 容 斥 原理 的 很 多 问题 中 , 所 有 集合 4; 都 具有 相同 
的 大 小 , 所 有 集合 4in4; = 45 也 具有 相同 的 大 小 , 而 且 所 有 集合 AiN AjnAx = 
Aijs 同样 具有 相同 的 大 小 , 等 等 . 这 使 得 计数 更 加 简单 , 于 是 公式 被 简化 成 了 


Ua 


和 


ca Oat emt 
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在 上 述 内 容 中 , 二 项 式 系数 表示 选择 集合 4i,..… i 的 方法 数 . 因为 这 是 公式 
中 非常 重要 的 部 分 , 所 以 我 们 快速 地 回顾 一 下 对 它 的 解释 ( 想 了 解 更 多 细节 , 请 参 
阅 注 5.2.2). 例如 , 当 考 察 4;; 时 , 我 们 需要 考虑 满足 1 < i < j < n 的 所 有 下 标 . 
就 等 于 问 , 在 1 和 n 之 间 无 序 地 选 出 两 个 不 同 的 数 有 多 少 种 方法 (我 们 只 不 过 把 
两 个 数 中 较 大 的 数 记 作 j, 较 小 的 数 记 作 ). 答案 就 是 (可 , 类 似 的 论证 可 以 对 其 他 
二 项 式 系数 做 出 解释 . 


5.2.3” 容 斥 公 式 的 证 明 
我 们 对 容 斥 原理 的 证 明 是 以 二 项 式 定 理 为 基础 的 , 也 就 是 


其 证 明 参 阅 A.2.3 节 . 最 重要 的 一 点 是 , 这 类 公式 对 所 有 的 x 和 y 都 成 立 ; 选择 不 
同 的 值 会 产生 不 同 的 表达 式 . 

一 个 很 好 的 选择 是 取 x = y = 1, 这样 就 得 到 了 2" = > ”0 (”). 注意 , 当 我 们 
有 个 元 素 时 , 由 这 些 元 素 构成 的 大 小 为 的 子 集 恰好 有 (”) 个 . 每 个 子 集 都 有 
定 的 大 小 ; 因此 , 如 果 把 各 种 大 小 的 子 集 数 都 加 起 来 , 就 得 到 了 子 集 的 总 数 , 也 就 是 
2"( 对 于 每 一 个 子 集 来 说 , 一 个 元 素 要 么 属于 它 , 要 么 不 属于 它 ). 
出 于 本 节 的 目的 , 我 们 想 让 x = -1 且 y=1. 于 是 有 


0= (-1+1)"= > () (—1)*1"-% 一 SC ( 


k=0 k=0 


现在 我 们 来 证 明 容 斥 原理 , 即 


U4=> 4I- > na4il+ > nd4ina4ki-… 
22 二 


1 l1<&i<j<k<n 


十 (一 上" 一 >》， [A nN Ars NN A 


1<&l1<l2<… < 1&n 


+ (1)” TAN As NN A,l. 


我 们 要 计算 元 素 z 在 等 式 每 一 侧 出 现 的 次 数 . 你 可 以 放心 地 浏览 下 面 的 论述 , 了 解 
这 个 式 子 为 什么 成 立 . 我 们 会 考察 更 多 情况 , 而 不 仅仅 是 需要 的 那些 , 对 其 讨论 也 
会 更 加 详细 , 而 不 只 是 为 了 帮助 计算 . 因此 , 你 可 以 先 随意 地 阅读 前 面 一 两 种 情况 ， 
然后 再 跳 到 对 一 般 情 况 的 论述 . 
。 情形 0: 元 素 x 不 属于 任何 A;. 因为 不 属于 任何 4;, 所 以 z 不 属于 并 集 ， 
它 对 左 侧 的 和 也 没有 任何 贡献 . 另外 , 由 x 不 属于 任何 4; 可 知 , 它 也 不 可 

能 属于 任何 交集 , 所 以 x 也 不 会 对 右 侧 的 和 有 任何 贡献 . 
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。 情形 1: 元 素 x 恰好 属于 
仙 


一 个 A;. | 
上 的 和 贡献 了 1. 那么 右 侧 的 和 呢 ? 因为 > 只 属于 一 个 4i, 所 以 它 不 会 包含 
在 任何 交集 ! 中 , 而 只 能 出 现在 4; 中 . 准确 地 说 , 假设 x 


在 左 侧 的 并 人 
® 情形 2: 元 素 z 


中 被 计算 一 次 ， 


人 


标 , 下 


在 左 侧 被 计算 一 次 . 为 了 更 加 准 


于 这 样 


的 zx 也 属于 并 集 , 因此 它 对 左 


只 属于 


43. 那么 ， 


并 且 只 在 右 侧 的 4s 中 被 计算 一 次 . 


恰好 属于 两 个 Ai. 现在 事情 变 得 更 有 意思 了 . 
集中 , z 被 计算 了 一 次 . 右 侧 呢 ? 不 妨 设 ze hs 是 
下 面 的 论述 均 成 立 . z 在 4s 
且 在 43n 47 中 计算 了 一 次 . 这 会 产生 什么 影响 ? 最 终 , 在 右 仆 
计算 了 1+1 一 1=1 次 , 而 这 恰好 是 它 在 左 侧 的 计数 . 注意 , z 不 
任何 集合 . 举 个 例子 , 因为 z & 44, 所 以 它 不 可 
为 不 属于 hs, 所 以 它 也 不 可 能 出 现 帮 
以 4s 和 47 的 交集 为 子 集 的 集合 . 这 村 
。 情形 3: 元 素 x 恰好 属于 三 个 A;. 和 之 前 一 样 , x 属于 左 侧 的 3 
1 不 妨 设 z 


中 计算 了 


的 


全， 


的 哪些 集合 


可 能 性 , 而 不 是 8 种 , 这 是 
样 就 排除 了 空 集 ). 集合 43、 
和 47mn 4s 的 计数 都 是 负 的 ( 它 
数 也 是 正 的 . 因此 ， 

重要 的 是 要 认识 


ES 
不 安 


在 右 侧 x 被 讨 
只 到 ,3 一 3 十 
(0 二 (十 ( 鸭 ;第 二 项 巧 从 三 个 下 
下 标 中 选 出 两 个 的 方法 数 , 最 后 一 项 是 从 三 个 下 标 中 
是 把 上 面 的 7 个 集合 分 成 了 三 种 情况 : 


包含 了 z? 这 样 的 集合 有 7 个 ， 
子 集 : 43、A7、As、A3 A7、Asn As、 A A 
因为 我 们 
47 和 4s 


E AsN A7N 


到 小 蝶 


至 少 要 从 43、 47 和 Asg 中 选择 一 个 ， 这 
的 计数 都 是 正 的 ， As 站 47、 As 门 48 


在 左 侧 的 并 
ZE 47; 对 于 任意 两 个 下 
中 又 计算 了 一 次 , 并 
岂 , 元 素 zx 被 
属于 
能 出 现在 44 mn 47 中 ; 
As 中 . 它 只 
集合 有 3 个 : 43、47 


一 次 ， 在 Ar 


又 因 
能 属于 那些 
和 Asnn Ar. 
集 , 所 以 它 
属于 43、47 和 48. 那么 右 侧 
它们 均 以 {43, 47, 4s} 的 交集 为 
共有 7 种 


1 有 一 种 


下 标 中 选 晶 


门 的 前 面 都 有 负 号 ), 而 4sn 47rn As 的 计 
和 敬 了 了 三 


3 十 1 二 1 次 . 
更 好 的 写法 . 我们 可 以 把 它 写成 
一 个 的 方法 数 , 第 二 项 是 从 三 个 


示 的 集合 , 以 及 三 


个 下 标 表 示 的 集合 


-开口 . 


选 出 三 个 的 方法 数 . 这 


一 个 下 标 表示 的 集合 , 两 个 下 标 表 


实际 上 , 3+3 二 1 还 有 一 利 
(D0). 


更 巧妙 的 


写法 : (DG 十 (0 (2) + 


。 情形 k: 元 素 x 恰好 属于 k 个 Ai, 其 中 及 > 3. 这 里 的 论证 与 之 前 的 情形 


类 似 , 只 是 在 最 后 多 了 一 点 代数 
发 生 什 么 ? 我 们 不 妨 设 z 属于 


运算 . 
Ai, 42 


对 于 任 取 的 个 下 标 , 论证 过 程 都 是 一 样 


法 有 (中 种. 那么 在 2) 
上 一 个 表达 式 的 形式 保持 一 致 


和 44| 中字 被 计算 了 (*) = (DD 一 


i 
显然 ， 


遇 于 左 侧 的 并 集 . 那么 右 侧 会 
, Ak; 这 里 的 假设 只 是 为 了 方便 
的 .从 大 个 下 标 中 选 出 一 个 的 方 
1(#) 次 (为 了 与 


化 


我 们 在 这 


从 大 个 下 标 中 选 出 两 个 共有 (和 和 
要 记 住 , 这 些 项 的 前 


中 被 计算 了 (*) 次 . 但 


给 出 了 攻 


yy 


方法 . 于 是 ,z 在 > cicignl4in4dj| 


面 都 有 一 个 负 号 , 所 以 z 的 计数 
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实际 上 是 -加 = (区) 

接 下 来 , 从 大 个 下 标 中 选 出 了 个 共有 (*) 种 方法 ; 因此 , 在 了 个 集合 的 

交集 中 , z 被 计算 了 (1)7-1(*) 次 ( 记 住 , 我 们 必须 时 刻 留 意 右 侧 的 负 号 ) 
对 于 在 0 和 上 之 间 取 值 的 所 有 j, 上 述 结论 均 成 立 , 而 x 在 右 侧 的 计数 

就 等 于 


CD 十 CD + (—1)3—1 四 十 十 (一 1)*1 | 


这 个 值 应 该 是 1, 我 们 把 上 式 加 上 -1+1. 这 只 是 加 了 一 个 零 , 并 没有 改变 
最 终 的 和 , 但 是 可 以 改写 这 个 代数 表达 式 : 我 们 将 看 到 一 个 有 用 的 关系 , 而 
且 还 会 用 到 二 项 式 定理 . 这 是 种 强大 的 技巧 , 也 是 我 最 喜欢 的 技巧 之 一 (更 
多 相关 信息 , 请 参阅 A.12 节 ). 我 们 看 到 


COP) + Ds) rn (+ (i) 


| 
汪 
十 

下 
| 


其 中 , 最 后 一 行 利 用 了 二 项 式 定理 (在 给 出 1 = (1)°(*) 之 后 , 我 们 才能 使 
用 二 项 式 定 理 ). 
上 面 的 论述 很 长 , 有 必要 回顾 一 下 , 看 看 我 们 都 做 了 什么 ， 式 子 的 左 侧 很 简 
单 一 一 元 素 z 要 么 属于 并 集 , 要 么 不 属于 并 集 . 但 右 侧 就 比较 复杂 了 . 如 果 z 只 
属于 一 个 4;, 那么 它 只 在 这 个 集合 中 被 计算 一 次 ; 如 果 xz 只 属于 两 个 4;, 那么 它 
会 在 3 个 集合 中 计数 ; 如果 它 恰好 属于 三 个 4;, 那么 会 在 7 个 集合 中 计数 ; 对 于 
般 的 情形 , 如 果 xz 恰好 属于 了 个 4;, 那么 它 就 要 被 计算 27 - 1 次 . 但 是 , x 的 计 
数 有 时 为 正 , 有 时 为 负 . 不 过 , 在 求 出 z 被 计算 的 总 次 数 后 , 左右 两 侧 的 计数 是 相等 
的 . 这 样 就 完成 了 对 公式 的 证 明 . 代数 运算 中 最 关键 的 一 步 是 使 用 二 项 式 定 理 并 注 
意 到 了 (1 十 1)*=0. 
5.2.4 利用 容 斥 原理 : 同 花 色 牌 型 
现在 是 时 候 来 举 个 例子 了 ! 回顾 一 下 3.4.2 节 中 拿 到 一 手 同 花色 牌 的 问题 . 我 O 


am 


~ 


SS 


S 
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们 先 求 出 至 少 一 个 人 
13 张 牌 , 并 且 要 使 得 至 


少 有 一 个 人 拿 到 了 一 


手相 


想 是 : 通常 避 


况 下 , 做 大 量 简单 计算 要 比 处 理 


个 


辣 花 色 的 丑 


| 


不 管 其 
到 一 手 同 花 色 牌 的 方法 
算出 后 面 这 个 问题 的 答 


第 一 
虑 另外 3 个 人 都 
我 们 并 没有 说 有 相同 花 
的 . 那么 事件 A1 nn 42 
牌 , 却 没 有 任 
趣 . 从 技术 上 革 
显然 也 会 迫使 第 四 个 人 


LI 
好 


3 


市 
| 入 


|412| = |41s 


何 关 于 第 三 个 人 包 
HF,， A1 mm A» 


了 , 现在 我 们 来 计算 至 少 有 
斥 原理 的 问题 中 , 我 们 会 经 常 看 到 下 面 这 种 


也 人 如 何 , 计算 某 部 分 人 拿 到 一 手 同 花 色 放 


案 . 


色 的 一 手 牌 至 


mt 412 表示 第 


Nn hs 意味 着 前 
到 一 手相 同 花 色 的 牌 ! 
个 人 拿 至 
性 


拿 


|A3a 


三 个 玩家 拿 到 某 些 特殊 
四 个 玩家 拿 到 某 些 特殊 


牌 n 
牌 


~ 


张 牌 共有 ( 
张 牌 中 选 
给 第 三 个 人 共有 (26) 利 


13 


) 


13 


中 = 


口 


步 是 选择 事件 . 让 A1 表示 第 一 个 人 拿 到 了 一 手相 同 花 色 的 牌 ， 


| 一手 同 花 色 牌 的 概率 (所 以 要 为 4 个 人 中 的 每 一 个 分 配 
). 容 斥 原理 的 主要 思 
杂 计 算 容 易 很 多 . 我 们 会 看 到 ， 
让 的 方法 数 要 比 计 算 单 独 一 个 人 拿 
数 容易 很 多 ; 利用 前 一 个 问题 的 结果 和 容 斥 原理 , 我 


门 能 够 


放 且 不 考 


I 第 四 个 人 的 信息 . 从 这 里 开始 ， 
3 个 人 都 合 到 了 一 手相 同 花 ; 


, 等 等 . 这 些 结果 是 根据 对 称 性 


1 种 方法 . 现在 我 们 必须 把 剩 下 的 上 
出 13 张 分 给 第 三 个 人 共有 (33) 种 方法 , 从 余下 的 26 张 租 


Es 


一 人 


方法 , 第 四 个 人 拿 到 的 上 


OIC 


13/ \13/ \13/ \13 


口 


于 


手 同 花色 
饮 ， 即 | 41| 


光 


是 说 这 手 牌 的 花 | 
个 人 和 第 二 个 人 都 拿 到 了 一手 相同 花色 的 


到 了 什么 ,我 们 按照 同样 的 方法 来 定义 4?、4s 和 44. 注意 ， 


I 底 是 什么 花色 , 而 色 是 相同 


办 


分 配给 其 


Ga) = 工科 


姬 ， 
到 


中 的 腺 


| 


青 会 变 得 非常 


色 的 牌 , 但 


F 意 取 牌 的 方法 数 相等 . 


可 能 . 


办 | 


) = 337 912 392 291 465 600. 


有 
这 


[人 


局 数 ， 在 涉及 容 
142| = |4s| = |44| 和 
推导 出 来 的 . 第 一 个 和 第 
而 第 二 个 和 第 四 个 玩家 任意 取 牌 的 方法 数 , 与 第 二 个 和 第 
第 一 个 和 第 三 个 玩家 介 
141| 是 多 少 呢 ? 第 一 个 人 的 花色 有 (人 种 选 法 , 接着 为 他 选 出 具有 该 花色 的 13 
电 人 .从 剩 下 的 39 
中 选择 13 张 分 
此 ， 


请 注意 , 上 述 情况 包含 了 其 他 人 也 拿 到 一 手相 同 花 色 的 牌 的 可 能 性 ! 这 种 情况 是 可 
以 的 , 实际 上 这 也 是 容 斥 原理 能 够 轻松 解 题 的 原因 . 事件 A1 只 
了 一 手相 同 花 色 的 牌 ， 而 不 考虑 其 他 3 个 人 的 情况 .这 要 比 计 算 只 有 第 一 个 人 拿 
到 了 一 手相 同 花 色 的 牌 的 方法 数 简单 很 多 . 事实 上 , 我 们 可 以 轻松 地 算出 这 种 只 考 
卡 第 一 个 人 牌 型 的 方法 数 , 然后 进一步 求 出 只 有 第 一 个 人 拿 到 一 手 同 花 色 牌 的 方法 


数 . 


|4in 4j| = 14i| 是 多 少 呢 ? 现在 我 们 有 两 个 特殊 的 人 , 他 


色 中 取 牌 . 为 这 两 个 人 


二 个 人 有 3 种 选择 . 考察 这 个 问题 的 另 一 利 


两 个 人 的 花色 , 那么 第 一 个 人 的 牌 型 有 ( 


一 和 


示 第 


一 个 人 拿 到 


门 都 只 能 从 一 种 花 


分 配 两 种 花色 共有 4. 3 种 方法 : 第 一 个 人 有 4 种 选择 , 第 
方法 是 , 选 出 两 种 花色 共有 (2) 种 方法 ， 
法 . 一 旦 确定 了 这 


13 
13 


1 


) 


种 ， 与 


Ce 


全 一 
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ud 


现在 还 剩 下 26 张 牌 ; 为 第 三 个 人 分 配 13 张 牌 共有 (26) 种 方法 , 那么 第 四 个 人 就 


只 有 (13) =1 种 分 法 . 于 


Pt 


》 


|Ai2| = 124 807 200. 


我 们 继续 考察 三 个 人 的 情况 , 即 hi 4j; nn Ax = hijk. 然而 , 如 果 有 三 个 人 都 拿 到 


了 一 手相 同 花 色 的 牌 , 那么 第 四 个 人 也 一 定 会 拿 到 一 手相 同 花 色 的 牌 . 我 们 可 以 按 
照 之 前 的 方法 来 计算 . 另外 , 我 们 还 可 以 这 样 考虑 : 这 里 有 4! 种 可 能 的 牌 型 (第 一 


个 人 有 4 种 可 能 的 牌 型 , 第 二 个 人 有 3 种 , 第 三 个 人 有 2 种 , 而 第 四 个 人 只 有 1 种， 


于 是 一 共有 4.3.2 


:1 二 4 二 24 种 可 能 的 结果 ). 因此 


4123| Ai24| |Ai34| 14234| |Ai234| = 24. 


现在 , 我 们 利用 容 斥 公式 来 计算 至 少 有 一 个 人 拿 到 一 手 同 花色 牌 的 牌 局 数 . 记 


住 , 下 述 所 有 可 能 情况 的 个 数 只 取决 于 下 标的 数量 , 而 与 下 标 是 什么 无 关 . 这 一 点 


对 我 们 求解 答案 很 有 帮助 . 结果 就 是 


4 


Sl 


4 
U 4， = > |4i|- 》， |Aij| 十 >》， |Aijx| — |A1234| 
i=1 


1&i<j<4 1<&i<j<k<4 


4 
= |A4i| Sl — |Ai2| >》， 十 |4123| >》 一 |41234| 
i=1 


1<i<j<4 1<i<j<k<4 


4 4 
= |A1|:4—|Ai2|: 加 十 |4123| . ( —|Ai234| :1 


= |A1|4— |Ai2|6++ |Aiz3|4 — |Ai234| 
= 1 351 649 568 417 019 272. 


容 斥 原理 还 有 其 他 一 些 有 趣 的 例子 . 对 于 某 个 给 定 的 方程 x 十 y = 12, 你 可 以 


利用 容 斥 原理 来 计算 , 当 x 和 yy 都 是 正 整数 时 , 把 12 分 配给 这 两 个 变量 共有 多 少 


种 不 同 的 方法 . 你 可 以 限定 这 些 值 大 于 或 小 于 某 个 数 , 也 可 以 规定 它们 不 相等 . 例 


如 , 假设 限制 z < 4 


和 满足 y < 5 的 那些 解 , 这 样 就 求 出 了 符合 条 件 的 解 的 个 数 . 有 一 些 解 会 同时 满足 


且 y > 6, 那么 可 以 先 算 出 一 共有 多 少 个 解 , 然后 减 去 满足 > > 5 


Zz 之 5 和 yy < 5, 所 以 它们 被 减 了 两 次 , 因此 还 要 把 它们 重新 加 回去 . 这 类 问题 或 许 


还 有 更 好 的 解法 ; 通常 你 更 关心 解 是 多 少 而 不 是 一 共有 多 少 个 解 , 但 有 时 你 只 想 知 


道 某 个 给 定 方程 的 
问题 . 


的 个 数 . 尽管 容 斥 原理 可 能 并 不 是 最 好 的 方法 , 但 它 总 能 解决 


容 斥 原理 的 一 个 重要 部 分 是 正确 地 选择 集合 . 恰当 地 选择 4; 会 使 问题 更 容易 


解决 . 在 上 面 这 个 人 


而 是 尝试 求 出 所 有 符合 条 件 的 解 , 那么 情况 就 会 更 加 复杂 . 我 们 给 出 最 后 的 例子 来 


说 明 这 一 点 . 


j 子 中 , 如 果 我 们 没有 意识 到 可 以 减 去 所 有 不 满足 约束 条 件 的 解 ， 
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考虑 马上 要 做 演讲 的 几 个 学 生 : Alice、Bob、Charlie 和 David. Alice 不 想 第 一 


个 演讲 , 而 David 不 想 最 后 一 个 演讲 . 那么 一 共有 多 少 种 不 同 的 泪 


讲 次 序 ? 现在 , 不 


考虑 限制 条 件 , 他 们 有 4 = 24 种 不 同 的 演讲 次 序 . 让 4; 表示 第 i 个 人 站 在 不 能 站 
的 位 置 上 的 排序 方法 数 . 那么 , A1 表示 Alice 第 一 个 演讲 的 排序 方法 数 , 即 3! = 6. 
由 于 Bob 和 Charlie 的 位 置 可 以 任意 选取 , 所 以 4。 = 0 且 A3 = 0. 最 后 , 44 是 
导致 David 最 后 一 个 演讲 的 排序 方法 数 , 也 就 是 3! = 6. 此 时 , 有 一 些 排序 会 使 得 
Alice 第 一 个 演讲 且 David 最 后 一 个 演讲 , 而 这 样 的 排序 被 减 了 两 次 , 所 以 我 们 要 


把 它们 再 加 回去 . Alice 第 一 个 演讲 日 David 最 后 一 个 演讲 的 排序 方法 有 2! = 2 种 . 


由 于 对 Bob 和 Charlie 没有 限制 , 因此 我 们 不 需要 考虑 其 他 
这 些 结 果 与 容 斥 原理 相 结 合 , 一 共有 24 一 (6 十 0 十 0 十 6) 十 2 二 14 利 


序 . 我 们 选择 的 集合 使 得 这 个 问题 求解 起 来 相当 简单 . 
5.2.5 ”从 “至 少 ” 到 “恰好 ”的 方法 


我 们 求 出 了 至 少 有 一 个 人 拿 到 一 手 同 花 色 牌 的 方法 数 ; | 
(9) 种 发 牌 的 方法 , 因此 只 要 让 前 面 的 结果 除 以 这 个 值 就 能 得 到 


一 手 同 花色 牌 的 概率 . 


是 , 将 


可 能 的 演讲 次 


于 -共有 的 的 的 
个 人 拿 到 


假设 我 们 现在 想 计 算 恰 有 一 人 拿 到 一 手 同 花 色 有 牌 的 概率 . 从 实 
与 至 少 有 一 个 人 拿 到 一 手相 同 花 色 牌 的 概率 是 一 样 的 , 因为 现实 
或 更 多 个 人 拿 到 一 手相 同 花 色 的 牌 ; 但 是 , 作为 数学 家 , 我 们 想 要 得 到 准 


9 度 出 发 , 这 
中 不 太 可 能 有 两 个 


角 答 - 


口外: 


可 以 利用 容 斥 公式 和 一 个 强大 的 原理 来 算出 答案 . 每 个 东 


个 名 


字 , 这 样 才能 轻松 地 引用 , 因此 我 们 把 这 个 原理 称 为 从 “至 少 ” 到 “恰好 ”的 方法 . 


法 是 ， 
Pr( 恰 好 有 K 个 发 生 ) 


从 “至 少 ” 到 “恰好 ”的 方法 : N(K) 表示 至 少 有 个 事件 发 生 的 方法 数 ; E(k) 
表示 恰好 有 个 事件 发 生 的 方法 数 ， 那么 E(k) = N(k) 一 N(k 十 1)， 等 价 说 


= Pr( 至 少 有 个 发 生 ) - Pr( 至 少 有 有 十 1 个 发 生 ). 


不 要 忘记 这 个 简单 的 原理 , 它 能 让 我 们 轻松 地 从 “至 少 ” 事件 过 渡 到 “恰好 ? 事 
件 . 我 们 还 会 再 看 到 它 , 因为 它 是 累积 分 布 方法 的 基础 (参阅 第 7 章 中 有 关 再 次 发 


生 的 内 容 ). 


一 手 同 花色 牌 的 方法 数 中 减 去 . 


现在 , 我 们 用 这 种 方法 来 计算 恰好 有 一 个 人 拿 到 一 手 同 花 
先 求 出 至 少 有 两 个 人 拿 到 一 手 同 花色 牌 的 方法 数 , 然后 再 把 它 从 至 少 有 一 个 人 拿 到 


色 牌 的 牌 局 数 . 我 们 


用 412、A1i3、A14、A23、Az4 和 As4 来 表示 有 两 个 人 拿 到 一 


的 6 种 
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可 能 情况 . 我 们 使 用 的 符号 与 之 前 稍 有 不 同 是 因为 这 种 符号 更 具有 启发 性 . 这 里 的 
414 表示 第 一 个 人 和 第 四 个 人 都 拿 到 了 一 手相 同 花 色 的 牌 ; 相反 , 如 果 把 这 6 个 事 
件 记 作 Bi, Bs,… , 那么 每 个 事件 所 缠 仿 的 意义 就 不 那么 清晰 了 (这 会 变 得 非常 
要 ). 在 这 类 问题 中 , 上 述 符 号 很 容易 造成 混乱 : 我 们 没有 把 这 些 事 件 的 并 明确 地 写 
出 来 , 而 只 对 它们 进行 陈述 . 
如 果 想 利用 容 斥 公式 来 计算 这 6 个 事件 的 并 的 大 小 ( 换 句 话说 , 至 少 有 两 个 人 
拿 到 一 手 同 花 色 牌 的 方法 数 ), 那么 我 们 就 要 算出 某 些 事 件 的 计数 . 
。 首 先是 6 个 事件 hi;j( 其 中 i 冯 7. 幸运 的 是 , 这 6 个 事件 发 生 的 次 数 是 相同 
的 (我 们 之 前 算 过 ), 也 就 是 
l= l= Mal | = | 0 
因此 , 这 6 个 集合 的 计数 为 
6.124 807 200 = 748 843 200. 

。 现 在 考察 一 个 较 难 的 计算 . |4ij mn hun| 是 多 少 呢 ? 答案 取决 于 i、j、1 和 mm 

是 4 个 不 同 的 下 标 、3 个 不 同 的 下 标 , 还 是 2 个 不 同 的 下 标 ( 记 住 ,; 和 7 且 

1 关 m, 但 1 或 m 可 能 等 于 i 或 7). 如 果 它 们 是 4 个 不 同 的 下 标 , 那么 要 考 

察 的 就 是 事件 A1234, 我 们 还 知道 这 个 事件 只 有 24 种 可 能 的 牌 局 . 如 果 是 3 
个 不 同 的 下 标 呢 ? 这 意味 着 有 三 个 人 都 拿 到 了 一 手相 同 花 色 的 牌 , 但 这 会 迫 
使 剩 下 的 一 个 人 也 拿 到 一 手相 同 花 色 的 牌 . 因此 , 如 果 有 3 个 不 同 的 下 标 ， 
那么 它 就 是 事件 A1234; 同样 地 , 现在 只 有 24 种 可 能 性 . 如 果 只 有 2 个 不 同 
的 下 标 呢 , 比如 412n 412? 这 是 我 们 所 考察 的 最 简单 的 交 : 它 就 是 这 个 事件 
本 身 , 而 且 我 们 知道 |412| = 124 807 200. 
好 的 , 我 们 已 经 知道 了 所 有 交集 的 大 小 . 现在 我 们 要 计算 每 种 情况 有 多 
少 种 可 能 . 从 6 个 事件 4i2、413、414、423、424 和 A34 中 选 出 2 个 共有 
(9) = 15 种 方法 . 在 这 15 种 取 法 中 , 4 个 下 标 互 不 相同 的 取 法 有 3 种 : 选 出 
412 和 434, 或 者 A13 和 424, 又 或 者 A14 和 423. 下 面 这 种 论述 是 错误 的 : 
因为 第 一 个 集合 可 以 任 取 , 之 后 第 二 个 集合 只 有 一 种 可 能 的 选择 , 所 以 共有 
6 种 可 能 的 取 法 . 为 什么 是 错 的 ? 因为 这 个 论述 对 两 个 集合 进行 了 排序 . 考 
察 “ 只 有 3 种 取 法 ”的 最 好 方法 是 , 先 构 造 一 个 有 序 集 , 然后 通过 除 以 2!( 即 
对 2 个 元 素 进行 排序 的 方法 数 ) 来 删除 这 个 次 序 . 所 有 下 标 均 不 相同 的 有 序 
对 共有 3.2= 6 个 (我 们 可 以 从 6 个 集合 中 任 选 一 个 作为 第 一 个 集合 , 那 
么 第 二 个 集合 也 就 被 确定 下 来 了 ), 因此 无 序 对 有 6/2! = 3 个 . 由 于 必须 从 
6 个 集合 中 选 出 2 个 不 同 的 集合 , 因此 不 存在 恰 有 2 个 不 同 下 标的 情况 . 所 
以 , 剩 下 的 12 种 取 法 都 恰 有 3 个 不 同 的 下 标 ; 同样 , 这 将 迫使 所 有 下 标 都 
不 相同 . 非常 好 的 一 点 是 这 15 个 交集 具有 相同 的 大 小 , 都 是 4 = 24. 因此 ， 
这 些 交 集 的 总 计数 为 -15. 4! = 一 360. 


lml 
[地 


Se 


182 第 5 章 计数 IT: 容 斥 原理 


。 首先 考察 3 个 不 同 集 合 的 交 , 这 3 个 集合 均 取 自 {412, 413, A14, 423, 424， 
434}. 这 3 个 集合 有 (9) = 20 种 取 法 . 无 论 取出 哪 3 个 集合 , 它们 都 至 少 有 
3 个 不 同 的 下 标 . (关于 这 一 点 , 最 简单 的 思路 是 当 取 出 2 个 集合 时 , 这 2 个 
虹 合 就 至 少 有 3 个 不 同 的 下 标 ! ) 因此 , 这 20 个 集合 均 满足 有 3 个 人 都 拿 到 
了 一 手相 同 花 色 的 牌 , 意味 着 第 4 个 人 也 拿 到 了 一 手相 同 花 色 的 牌 . 因此 ， 
于 20 个 集合 中 的 每 个 都 包含 了 24 个 元 素 , 它们 的 计数 为 20 .24 = 480. 
。 现 在 来 看 看 4 个 不 同 集合 的 交 . 从 6 个 集合 中 选 出 4 个 共有 (9) = 15 种 
方法 , 并 且 每 个 交集 都 是 A1234( 取 到 了 所 有 下 标 ), 那么 这 种 情况 的 计数 为 
一 15.24 = 一 360. 
。 接 下 来 考虑 的 是 5 个 集合 的 交 . 这 5 个 集合 有 (5) = 6 种 取 法 . 它们 的 交集 
台 终 是 41234, 其 总 计数 就 是 6 .24 = 144. 
。 最 后 考察 这 6 个 集合 的 交 . 它们 有 (9 = 1 种 取 法 , 而 交集 仍然 是 A1234, 于 
是 这 种 情况 的 计数 为 -1.24 = 一 24. 
综 上 所 述 , 由 容 斥 公 式 可 知 至 少 有 2 个 人 拿 到 一 手 同 花色 牌 ( 记 住 这 是 6 个 事 
件 的 并 ) 的 可 能 性 有 
748 843 200 — 360 + 480 — 360 + 144 — 24 = 748 843 080. 
现在 我 们 可 以 求 出 恰好 有 一 个 人 拿 到 一 手 同 花 色 牌 的 牌 局 数 . 在 5.2.4 节 中 , 我 
们 证 明了 至 少 有 一 个 人 拿 到 了 一 手 同 花色 牌 的 牌 局 数 为 1 351 649 568 417 019 272; 
刚刚 又 证 明了 至 少 有 两 个 人 拿 到 一 手 同 花 色 牌 的 牌 局 数 是 748 843 080. 因此 , 恰好 
有 一 个 人 拿 到 一 手 同 花色 牌 的 牌 局 数 为 1 351 649 567 668 176 192. 
记 住 , 尽 可 能 地 去 检验 答案 . 现在 , 我 们 可 以 对 748 843 200 一 360 十 480 一 360 十 
144 一 24 做 很 好 的 检验 . 第 一 个 数 是 748 843 200, 它 等 于 |Aiz| 十 |4is| 十 |A14| 十 
1423| 十 |424| 十 |4s4|. 如 果 有 三 个 人 拿 到 一 手 同 花 色 牌 , 那么 事实 上 所 有 人 都 拿 到 了 
一 手 同 花色 的 牌 . 这 样 的 牌 局 有 24 种 , 而 每 种 牌 局 都 被 算 入 了 上 面 的 和 . 因此 , 虽 
然 我 们 认为 这 个 和 表示 至 少 有 两 个 人 拿 到 一 手 同 花 色 牌 的 牌 局 总 数 , 但 是 在 这 个 和 
中 , 四 个 人 都 拿 到 一 手 同 花色 牌 的 24 种 牌 局 被 计算 了 6 次 , 而 非 一 次 . 所 以 , 我 们 
必须 减 去 5.24 = 120. 回 到 最 初 的 表达 式 , 我 们 注意 到 一 360 十 480 一 360 十 144 一 24 = 
120 = -5 .24. 能 用 一 种 略 有 不 同 的 方式 来 解释 代数 表达 式 并 看 到 一 致 性 , 这 是 非 
常 棒 的 . 


5.3 错 排 


如 果 有 7? 个 物体 , 那么 把 它们 有 序 地 排 成 一 列 共 有 ml 种 方法 . 在 大 量 问题 中 ， 
我 们 关注 的 焦点 是 一 些 特殊 排列 . 例如 , 假设 有 n 个 人 . 我 们 要 处 理 nn 个 信封 入 n 
封 信 . 遗憾 的 是 , 本 该 把 信 正 确 放 入 信封 的 人 今天 心情 不 太 好 , 只 把 信和 胡乱 地 塞 进 


5.3 
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了 信封 里 . 那么 , 所 有 信 都 没有 放 入 正确 信封 的 放 法 有 多 少 种 ? 这 被 称 为 错 排 , 通 
的 事件 ! 如 果 能 找到 这 个 问题 的 答案 , 那么 我 们 就 可 以 回答 一 


笛 被 认为 是 一 种 糟糕 


个 相关 问题 : 至 少 有 一 


时 信 放 对 的 方法 有 多 少 种 ? (就 是 用 nl 减 去 错 排 的 个 数 .) 


当然 , 我 们 能 做 的 不 仅仅 是 计数 , 还 可 以 计算 概率 . 如 果 这 nl 个 排列 是 等 可 能 


的 , 那么 错 排 的 概率 就 等 于 错 排 的 个 数 除 以 nl. 稍 后 我 们 会 看 到 当 n 一 oo 时 有 一 
个 漂亮 的 极限 , 接 下 来 还 会 讨论 一 些 相关 应 用 . 


5.3.1 ” 错 排 的 个 数 


在 这 nl 个 排列 
个 元 素 不 能 在 第 1 个 位 置 上 , 第 2 个 元 素 也 不 能 在 第 2 个 位 置 上 ， 
(2,3,4,1) 是 错 排 , 因为 每 个 数 的 位 置 都 发 生 了 移动 ; 但 (3,2,4,1) 就 不 是 错 排 , 因 


FP, 所 有 元 素 都 不 在 初始 位 置 的 排列 有 多 少 个 


为 2 仍 在 第 2 个 位 置 上 


事实 上 , 我 们 可 
的 排列 方法 有 多 少 和 


以 轻松 地 解决 一 个 相关 问题 , 即 至 少 一 个 元 素 回 到 它 初始 位 置 


? 这 意味 着 第 1 
依 此 类 推 . 例如 ， 


.为 什么 这 个 问题 更 容易 解决 ? 回顾 一 下 容 斥 原理 的 陈述 ( 参 
阅 5.2.2 节 ). 我 们 证 明了 如 何 用 事件 的 交 来 描述 至 少 有 一 个 事件 发 生 , 而 且 交通 党 


较 容易 计算 . 要 想得到 错 排 的 个 数 , 只 需要 从 nl 中 减 去 非 错 排 的 个 数 . 

不 管 什么 时 候 使 用 容 斥 原理 , 首先 要 做 的 就 是 构造 事件 . 我 们 
一 个 元 素 没有 被 移动 的 排列 方法 数 . 让 4; 表示 i 没有 被 移动 . 那么 , 41U 42U.…U4, 
表示 在 重 排列 中 , 至 少 有 一 个 元 素 仍 位 于 原来 的 位 置 上 ， 这 正 是 我 们 想 要 计算 的 ， 
由 容 斥 公式 可 知 , 它 的 基数 等 于 


U4 
i=1 


= >》 |4i|— >》， AiN Aj 二 +… 十 (-1)” 4m 
i=1 


TI 


试图 找 出 至 少 有 


NA. 


幸运 的 是 , 这 个 表达 式 可 以 进一步 简化 . 这 nn 个 4; 具有 相同 的 大 小 , 都 是 |41|. 
原因 是 对 称 性 一 一 我 们 总 是 可 以 对 它 重 新 标记 , 并 假设 它 就 是 第 


一 个 没有 被 移动 


的 元 素 . 同样 , (") 个 集合 4 mn 4; 也 具有 相同 的 大 小 , 都 等 于 |4;n 4j| = |4izl. 继 
续 , 我 们 发 现 (3) 个 集合 4; mn Aj;N Ax 的 大 小 也 都 相等 , 即 14 mn Aj;N Ax| =|4i 和 | 
当然 , 其 他 项 也 有 类 似 结 果 . 于 是 


Ua 
i=1 


现在 要 计算 等 号 右 侧 的 各 个 量 . 很 幸运 , 它们 并 不 难 算 . 在 求 下 列 数值 时 , 我 们 
花 了 点 时 间 把 结果 写成 了 较 实 用 的 代数 表达 式 , 其 中 的 规律 在 刚 开 
楚 , 但 最 后 我 们 会 居然 大 悟 . 

。|A41| = (n 一 1)!. 为 什么 ?第 1 个 元 素 的 


n 
ls 网 [Aij| + + (—1)™ |A2...nl. 


定 处 于 第 1 个 位 置 上 . 现在 我 们 要 对 n 一 1 个 对 象 进行 排列 
素 有 (n 一 1)! 种 排列 方法 . 这 样 的 集合 有 n= (") 种 . 于 是 有 n(n 一 DD)! 二 nl 


始 时 并 不 是 很 清 


位 置 是 固定 的 , 因此 在 新 排列 中 它 一 


, 而 这 nn 一 1 全 元 
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e。|4ia| = (mn 一 2)!. 推导 过 程 与 上 面 类 似 . 前 2 个 元 素 的 位 置 是 固定 的 . 现在 


还 剩 下 n 一 2 个 元 素 , 把 这 n 一 2 个 元 素 排 成 一 列 有 (n 
这 2 个 集合 有 (中 种 可 能 的 选择 . 于 是 有 


n(n—1) 


2)! 种 方法 . 另外 ， 


站 


2)! = 


2 


。|412. 放 = (mn 一 让!. 为 了 看 清楚 这 一 点 , 我 们 让 前 了 个 元 素 的 位 置 保持 不 变 . 


现在 还 剩 下 一 7 个 元 素 ， 


因此 把 它们 排 成 一 列 有 (mn 一 力 ! 种 方法 . 这 j 个 


集合 有 (") 种 可 能 的 选择 . 于 是 有 
nnao1):.…(n— (7— 1)) ! 
有 了 时候, 我 们 需要 过 段 时 间 才能 看 出 其 中 的 规律, 第 一 种 情形 的 结果 是 mu, 第 


会 看 至 
台 时 , 你 没有 把 第 
该 回 过 头 去 看 看 是 否 存在 一 般 规 律 . 这 
该 写成 nl/nl, 而 不 是 1. 
综 上 所 述 , 由 容 斥 公式 可 得 
Ua () |41| 一 Ee |Aiz| 十 


情形 的 结果 是 nl/2， 只 有 在 讨论 了 一 


也 表明 了 1 


般 情 形 之 后 


(我 们 得 到 了 nl/ 让, 我 们 才 
| 应 该 把 第 一 个 结果 写成 n1/1, 把 第 二 个 结果 写成 n!/21. 不 要 担心 一 刚 
个 结果 看 作 nl/1! 是 正常 的 ; 但 是 , 刀 


E 看 到 了 nl/j1 之 后 , 就 应 


|412..| 给 出 的 最 后 一 个 结果 应 


十 ( 一 人” () |Ai2...nl 


nn Di (FD (0) + 


+ CD (mo) 


nl nl! n! nl! 
TT ta a 


nl 


所 以 , 我 们 已 经 找到 了 计算 非 错 排 数 的 公式 . 因此 , ml 减 去 这 个 值 就 是 错 排 的 


个 数 . 让 D， 表示 {12…… ,n} 的 错 排 数 . 我 们 发 现 
nl nl nl! nl! nnl 
Dem 


在 下 一 小 节 中 , 我 们 将 看 到 这 个 公式 可 以 写成 更 具 启 发 性 的 形式 . 


5.3.2 ” 错 排 数 的 概率 


在 5.3.1 节 中 , 我 们 利 / 
排 就 是 对 这 些 数 重 新 排列 , 并 


容 斥 原理 求 出 了 集合 {1,2,… 


,nn} 的 错 排 数 . 记 住 , 错 


错 


要 使 得 每 个 数 都 移动 到 与 初始 位 置 不 同 的 新 位 置 
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上 . 于 是 , {3,4,2,1,5,7,6} 不 是 {12,3,4,5,6,7} 的 错 排 , 因为 5 仍然 在 第 5 个 位 
置 上 ; 但 {2,3,1,7,6,5,4} 就 是 错 排 . 我 们 看 到 , n 个 对 象 的 错 排 数 (用 D;, 来 表示 ) 


就 是 


万 on LO n! nl! | TI 到 
a 


现在 , 我 们 要 花 点 时 间 看 看 考察 这 个 公式 的 男 一 种 更 好 的 方法 . 
首先 要 注意 的 是 每 项 中 都 有 一 个 nl, 所 以 应 该 把 它 提出 来 . 这 样 就 得 到 了 


1 1 1 1 。 
mr=ala 本 本 二 ) 

在 这 里 我 们 有 了 真正 的 进展 , 因为 n! 不 是 一 个 普通 的 数 , 而 是 一 个 非常 有 意义 的 

量 : 它 是 ”个 对 象 的 排列 数 ! 因此 , 如 果 两 边 同 时 除 以 nl, 那么 我 们 就 得 到 了 全 体 
错 排 所 占 的 百分比 : 

D, i 过 

人 

如 果 你 了 解 微 积 分 知识 , 那么 右 侧 的 表达 式 看 起 来 就 会 非常 眼熟 , 它 正 是 ez 的 

级 数 展开 式 . 指数 函数 是 整个 数学 领域 中 最 重要 的 函数 之 一 (参阅 B.5 节 , 以 便 快 

速 回顾 ). ez 的 一 个 描述 是 


Ce k 作 民 
Xe TT 站 ja 寺 各 :和 
eS “To 3 


F 面 的 值 接近 于 e-1, 不 同 之 处 在 于 这 里 只 有 有 限 多 项 . 

这 种 做 法 没什么 问题 . ez 的 级 数 展开 式 收敛 地 非常 快 . 举 个 例子 , 如 果 n= 10， 
那么 e-! 就 约 等 于 0.367 879 441 2, 而 Dn /nl 大 概 是 0.367 879 464; 两 者 之 差 约 为 
0.000 000 023. 换 句 话说, 当 等 于 10 时 , 我 们 的 答案 已 经 非常 接近 于 e-! 了 . 

这 一 切 都 意味 着 什么 呢 ? 这 意味 着 , 如 果 我 们 取 n 个 元 素 并 考虑 它们 的 一 个 
随机 排列 , 那么 所 有 元 素 都 不 在 初始 位 置 上 的 概率 会 相当 高 : 约 等 于 e-1, 大 概 是 
36.79%. 每 三 种 排列 中 , 使 得 所 有 数 都 发 生 移动 的 排列 不 止 一 种 ! 稍 后 , 我 们 将 回 
到 这 个 题目 并 解决 一 些 相关 问题 , 比如 , 在 一 个 随机 排列 中 位 置 没有 改变 的 元 素 的 
预期 数量 是 多 少 . 

5.3.3 ” 错 排 试 验 的 代码 

和 往常 一 样 , 花 时 间 编 写 一 些 代 码 来 检验 我 们 的 理论 是 很 有 必要 的 . 这 里 的 情 
况 有 点 复杂 , 因为 错 排 的 概率 是 个 关于 n 的 函数 , 所 以 我 们 要 记 住 , 当 考 虑 极限 时 
结果 只 能 是 1/e. 
derangement[n_, numdo._] := Module[{}, 

count = 0; (* 将 对 成 功 的 计数 器 设置 为 0 *) 
(* 对 有 限 的 n 和 n --> oo 时 的 情况 进行 预测 *) 
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theory = Sum[(-1)“k/k!, {k, 0, n}]; 
limit = 1/E; 
people = {}; (+ 这 是 人 员 列 表 *) 
For[i = 1, i <= n, i++, people = AppendTo[people, i]]; 
For[m = 1, m <= numdo,，m++，(* 主 循环 *) 
{ 
mix = RandomSample [people]; (* 随机 混合 人 员 *) 
found = 0; (* 将 found 设 置 为 0) 如 果 found 变 为 1， 则 有 人 的 位 置 没 发 生 


变动 *) 
For[i = 1, i <= n, i++, 
{ 
If [mix[[i]] == i, 
{ 
found = 1; 
i = n + 1; (* 退出 循环 : 为 什么 要 继续 计算 ! *) 
}]; 
}]; 
If [found == 1，count = count + 1]; (* 如果 found 等 于 1， 
那么 count 加 1 *) 
}]; 


Print["Theory is ", 100. theory, "%."]; 
Print["Limit is ", 100. limit, "%."]; 
(* 我 们 希望 得 到 错 排 的 概率 ， 它 等 于 1 减 去 “有 人 的 位 置 没 发 生变 动 ” 
的 概率 *) 
Print["Observe ", 100. - 100. count/numdo, "%."]; 
] 
例如 , 当 n=5 时 , 如 果 把 试验 运行 1000 万 次 , 那么 我 们 会 得 到 : 
Theory is 36.6667%. 
Limit is 36.7879%. 
Observe 36.6783%. 
进行 这 么 多 次 试验 的 原因 是 , 对 于 有 限 的 上” 和 n 一 co, 它们 的 结果 在 n= 5 
时 会 有 很 小 的 差别 . 稍 后 , 利用 中 心 极限 定理 , 你 将 学 到 如 何在 模拟 值 周围 建立 置 
信 区 间 , 并 看 看 它们 是 否 与 预测 值 一 致 . 当 ”= 20 时 , 情况 会 有 很 大 的 不 同 , 因为 
有 限 n 和 极限 情况 下 的 差 值 可 以 忽略 不 计 : 
Theory is 36.7879%. 
Limit is 36.7879%. 
Observe 36.8023%. 
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5.3.4 错 排 的 应 用 


我 们 计算 了 {1,… ,n} 有 多 少 个 错 排 , 并 给 出 了 计算 错 排 概率 的 公式 (这 个 公 
式 非 常 好 , 可 以 推导 出 当 n 趋 近 于 无 穷 时 的 极限 值 ). 但 是 , 我 们 还 没有 解释 为 什么 
要 关注 错 排 . 

在 高 等 数学 中 , 有 很 多 地 方 都 出 现 了 错 排 , 但 这 看 起 来 好 像 不 太 可 信 . 现在 我 
们 讨论 一 个 通信 理论 的 例子 . 如 果 你 以 前 没 学 过 图 论 , 那么 我 们 在 这 里 快速 介绍 一 
下 ! 图 是 由 点 和 边 构成 的 , 这 里 的 点 被 称 为 项 点 (奇异 顶点 ), 而 每 条 边 恰好 连接 两 
个 顶点 . 如 果 是 一 个 简单 图 , 那么 在 任意 一 对 顶点 之 间 最 多 有 一 条 边 ; 重复 的 边 被 
称 为 复合 边 . 通常 情况 下 , 我 们 不 允许 自 循环 , 也 就 是 说 每 条 边 必 须 连接 两 个 不 同 
的 顶点 . 如 果 一 个 图 的 顶点 可 以 分 成 两 组 4 和 B, 并 且 每 条 边 都 由 4 和 B 中 各 一 
个 顶点 来 连接 (所 以 4 中 的 顶点 之 间 没 有 边 , 且 B 中 的 顶点 之 间 也 没有 边 ), 那么 
这 个 图 就 叫 作 二 部 图 . 
许多 问题 都 与 图 有 关 . 在 通信 理论 中 有 个 很 好 的 例子 . 把 每 个 顶点 看 成 一 台 计 
算 机 , 把 边 看 成 计算 机 之 间 的 连接 (你 也 可 以 把 顶点 看 作 城 市 , 把 边 看 作 城 市 之 间 
的 道路 ). 我 们 需要 一 个 连接 良好 的 系统 : 希望 每 一 台 计 算 机 都 能 快速 地 连接 到 网 
络 中 的 其 他 任何 一 台 计 算 机 . 一 种 方法 是 在 任意 两 台 计 算 机 之 间 建 立 连接 ; 我 们 把 
结果 图 称 为 完全 图 , 因为 它 包 含 了 所 有 可 能 的 边 . 然而 , 这 会 付出 高 昂 的 代价 . 如 
果 有 n 台 计算 机 , 那么 我 们 就 需要 (") = n(n _ D/2 条 边 来 把 所 有 计算 机 连接 起 
来 . 虽然 这 能 很 好 地 完成 连接 工作 , 但 成 本 通常 非常 高 . 

这 迫使 人 们 寻找 边 数 较 少 但 仍 具 有 强大 连接 能 力 的 网 络 ， 例如 , 在 完全 图 中 ， 
从 任意 一 个 顶点 到 男 一 个 顶点 只 需要 一 步 , 但 代价 是 建立 n(n 一 1)/2 条 边 . 通常 情 
况 下 , 一 个 很 好 的 折 中 方案 是 让 边 数 以 n 的 线性 函数 增长 , 从 一 个 顶点 到 另 一 个 顶 
点 的 步 数 以 logn 的 速度 增长 . 

同样 , 我 们 的 目的 不 是 研究 这 个 理论 ( 想 阅 读 更 多 内 容 , 请 参阅 [HJ), 而 是 要 
提醒 你 图 论 中 都 有 什么 . 令 人 惊讶 的 是 , 虽然 利用 数论 的 性 质 可 以 得 到 一 些 结构 深 
奥 且 清晰 的 图 , 但 实际 上 几乎 所 有 的 图 都 能 很 好 地 发 挥 其 作用 . 

有 一 些 很 好 的 算法 可 以 创建 随机 二 部 图 . 设 


A= {1,2,.…. ,n} 


是 由 n 个 顶点 构成 的 集合 , B = 行 ,2,… ,n} 是 另 一 个 包含 n 个 顶点 的 集合 . 对 
B = {1,2,… ,n} 进行 一 次 随机 排列 , 然后 把 4 中 的 顶点 i 与 排列 后 B 中 第 i 个 
位 置 上 的 顶点 连接 起 来 . 例如 , 如 果 n = 5 并 且 随 机 排列 是 (4,2,3,5,1), 那么 就 把 
4 中 的 1 与 B 中 的 4 连接 起 来 , 把 4 中 的 2 与 B 中 的 2 连接 起 来 , 依 此 类 推 
通过 取 一 些 随 机 排列 , 我 们 可 以 得 到 相当 好 的 图 . 这 种 图 的 成 本 较 低 (没有 太 
多 的 边 ), 但 通常 具有 良好 的 连接 性 . 问题 是 我 们 希望 得 到 一 个 简单 图 不 希望 


和 
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两 个 顶点 之 间 有 多 条 边 . 这 是 因为 一 旦 


个 顶点 连接 起 来 , 它们 之 间 就 建立 了 连接 ， 


而 边 就 可 以 更 好 地 用 于 其 他 方面 . 在 计算 机 科学 领域 中 , 你 通常 会 关注 算法 的 效率 ， 


也 就 是 说 , 运行 这 个 算法 需要 多 长 时 间 . 


才 会 保 


我 们 的 问题 中 , 对 于 每 一 个 新 排列 , 只 有 在 它 不 引入 复合 边 的 前 提 下 , 我 们 


留 . 因此 , 对 我 们 来 说 , 错 排 是 有 好 处 的 , 我 们 想 知 道 


得 到 一 个 错 排 的 概率 有 


多 大 . 当然 , 这 比 找到 错 排 更 加 复杂 . 我 们 要 确保 这 些 排列 互 为 错 排 ， 如 果 只 需要 


两 个 排列 , 那么 情况 不 会 太 糟糕 ; 但 是 , 由 了 个 排列 不 仅仅 与 元 素 的 初始 位 置 
此 这 个 问题 很 快 就 会 变 得 十 分 具有 挑战 性 . 
对 于 那些 仍 在 努力 了 解 错 排 多 么 有 用 的 读者 , 请 考虑 下 面 的 例子 . 假设 在 一 家 


有 关 , 还 与 其 他 排列 有 关 , 因 


餐厅 里 


有 mn 个 人 , 他 们 碰巧 都 穿着 同样 的 外 套 .他们 都 把 外 套 脱 了 下 来 并 放 在 了 


壁橱 里 
一 件 外 
你 也 可 


, 直到 吃 完 饭 为 止 . 一 个 明显 且 重要 的 问题 是 , 如 果 他 们 离开 时 随意 地 拿 走 


套 , 那么 所 有 人 在 离开 这 家 餐馆 时 都 没 拿 走 自己 外 套 的 概率 是 多 少 ? 同样 ， 
以 问 至 少 有 一 个 人 在 离开 时 拿 走 了 自己 外 套 的 概率 


是 多 少 . 这 是 个 很 好 的 


普 排 例子 ， 这 种 情况 不 会 经 常 发 生 , 而 且 通 常 不 会 发 生 在 很 多 人 身上 , 但 有 时 人 们 
确实 会 拿 错 外 套 . 为 了 让 这 个 例子 更 贴近 生活 , 你 可 以 把 外 套 蔡 换 成 帽子 或 者 两 外 


(如 果 你 是 电视 节目 《老爷 老 妈 的 浪漫 史 》 的 粉丝 , 那么 可 以 
伞 ), 又 或 者 是 那些 看 起 来 更 有 可 能 的 物品 . 在 一 次 乘 飞 机 出 行 后 , 你 拿 走 别 人 行李 


的 概率 是 多 少 ? (这 就 是 为 什么 很 多 人 会 在 他 人 


把 外 套 替 换 成 黄色 的 十 


] 的 行李 箱 上 装饰 一 些 色彩 鲜艳 的 物 


品 ! ) 这 些 都 是 相当 基本 且 微 不 足 道 的 例子 , 但 是 展示 了 这 些 概 念 是 如 何 应 用 于 日 


5.4 总 结 


I 越 来 越 多 的 事实 . 为 了 应 付 考试 , 人 们 总 希望 把 所 


都 记 住 , 但 在 生活 中 这 是 个 粳 糕 的 选择 . 显然 , 我 并 不 是 建议 你 把 所 有 知识 


都 态 掉 , 但 如 今 查找 想 要 的 东西 是 非常 容易 的 . 浏览 几 分 钟 


常生 活 的 . 
随 着 不 断 学 习 , 你 将 会 看 至 

有 知识 

的 事实 和 相关 内 容 . 你 要 掌握 的 是 如 何 应 月 
这 

候 快 速 地 重新 推导 出 事实 . 


网 页 就 能 得 到 大 量 宝贵 


日 这 些 事 实 来 建立 理论 . 


就 是 我 强调 这 些 技巧 的 原因 . 如 果 记 住 了 这 些 方法 , 那么 你 就 能 在 需要 的 时 


因此 , 你 不 应 该 记 


Ss 


而 应 该 掌握 容 斥 原理 的 陈述 , 以 便 在 需要 时 使 用 它 . 
当然 , 说 比 做 更 容易 . 解决 问题 通常 有 三 个 主要 的 阶段 . 


。 理解 问题 . 有 时 候 ， 


虽然 问题 叙述 得 很 清楚 , 但 往生 


你 必须 要 思考 并 有 有 


。 找 到 问题 的 突破 口 . 通 


i 定 它 到 底 是 什么 意思 ， 你 要 确 


如 何 推 导 扑 克 牌 型 和 错 排 的 个 数 ， 


E 有 几 种 不 同 的 解释 , 而 
果 能 够 理解 所 有 术语 的 


常情 况 下 , 题目 中 的 术语 会 提供 如 何 解 题 的 线索 . 
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例如 , 我 们 已 经 看 到 了 不 同 的 表达 是 如 何 瞳 示 不 同方 法 的 .我 们 已 经 说 
过 , 你 要 知道 所 有 术语 的 含义 . 另外 , 你 还 要 知道 哪些 定理 使 用 了 这 些 术 
语 , 因为 这 会 为 你 提供 一 个 解 题 的 出 发 点 . 
。 开 始 解 题 . 一 旦 确定 了 一 种 解 题 方法 , 那 就 一 定 要 着 手 去 做 . 如 果 想 利用 
容 斥 原理 , 那么 你 必须 确定 都 有 哪些 集合 , 以 及 它们 的 概率 都 是 多 少 . 
面 对 一 个 问题 却 无 从 下 笔 是 件 很 可 怕 的 事 . 我 见 过 很 多 这 样 的 学 生 , 在 找到 能 
解决 问题 的 方法 之 前 , 他 们 不 愿意 做 任何 尝试 , 最 后 只 能 发 呆 . 不 要 害怕 尝试 一 些 
东西 . 如 果 它 能 奏效 , 那 就 太 棒 了 ; 不 行 的 话 就 尝试 其 他 方法 . 对 于 一 种 方法 , 要 给 
它 一 个 机 会 ; 如 果 不 起 作用 , 就 把 它 搁置 在 一 边 , 去 试 试 男 一 种 方法 . 
最 后 一 条 建议 是 : 确保 你 考虑 了 所 有 可 能 的 情况 . 概率 之 所 以 有 名 是 因为 它 包 
含 一 些 涉 及 微妙 计数 情形 的 琼 手 问题 人 们 很 容易 对 某 些 项 进行 重复 计算 , 并 忽略 
其 他 项 . 你 要 确保 把 所 有 事情 都 考虑 在 内 , 并 涵盖 所 有 可 能 的 情况 . 为 了 把 这 一 点 
讲 清楚 , 我 们 将 以 电影 《公主 新 娘 》 的 一 个 有 趣 场景 来 结束 . 维 效 尼 抓 到 了 布 卡特 ， 
并 打算 杀 了 她 , 而 黑 衣 人 正在 追踪 维 效 尼 , 并 不 惜 一 切 代价 拯救 布 卡 特 . 维 效 尼 把 
此 首 放 在 布 卡特 的 喉 晓 边 , 并 警告 黑 衣 人 , 如 果 他 再 往 前 走 一 步 , 布 卡特 就 会 死 . 黑 
衣 人 拿 出 了 两 杯 酒 . 在 维 效 尼 看 不 到 的 情况 下 , 他 把 毒药 放 在 了 一 杯 酒 里 , 然后 在 
每 个 人 面前 各 放 了 一 杯 酒 . 
黑 衣 人 : ”好 了 . 哪 杯 酒 有 毒 ? 智慧 之 战 开 始 了 . 由 你 做 出 选择 , 然后 我 们 一 起 
把 酒 喝 掉 , 这 样 一 切 都 结束 了 , 看 看 到 底 谁 是 对 的 , 谁 会 死 . 
维 诊 尼 :” 那 还 不 简单 . 我 要 做 的 就 是 根据 我 对 你 的 了 解 来 猜测 : 你 会 把 毒药 
放 进 自己 的 酒杯 还 是 敌人 的 酒杯 ? 聪明 人 会 把 毒药 放 进 他 自己 的 酒 
杯 里 ， 因 为 他 知道 只 有 大 傻瓜 才 会 接受 别人 给 的 东西 . 我 不 是 个 大 
傻瓜 ,所 以 我 肯定 不 会 选择 你 面前 的 酒 . 但 你 一 定 知 道 我 不 是 个 大 傻 
瓜 , 你 放 毒 药 时 就 知道 ; 所 以 , 我 显然 不 能 选择 自己 面前 的 酒 . 

黑 衣 人 : 那么 你 已 经 做 出 决定 了 ? 

维 诊 尼 : 还 没有 . 

这 一 幕 继续 发 展 下 去 : 为 了 确定 哪 杯 酒 有 毒 , 维 效 尼 给 出 了 一 连 串 的 推理 . 他 
直 在 寻找 所 有 相关 的 可 能 性 . 最 后 , 他 谎 称 看 到 了 什么 东西 来 分 散 黑 衣 人 的 注意 
力 . 当 黑 衣 人 转 过 身 时 , 维 兹 尼 迅 速 地 交换 了 两 杯 酒 , 然后 喝 掉 了 自己 面前 的 那 杯 . 
因为 黑 衣 人 没有 回避 人 饮酒, 所 以 维 兹 尼 确 信 自 己 骗 过 了 他 , 拿 到 了 无 毒 的 那 杯 酒 . 但 
很 不 幸 , 维 兹 尼 犯 了 个 典型 的 概率 错误 . 他 忘记 了 一 种 可 能 性 , 并 因此 送 命 . 

布 卡特 : 仔细 想 想 , 你 的 那 杯 酒 是 有 毒 的 . 
黑 衣 人 : 两 杯 酒 都 有 毒 . 我 花 了 几 年 时 间 来 形成 对 这 种 毒性 的 免疫 力 . 
啊 , 遗漏 一 种 情况 是 如 此 危险 ! 


190 第 5 章 计数 下 容 斥 原理 


习题 5.5.1 


5.5 习 题 


假设 在 每 场 比赛 中 两 队 获 胜 的 概率 都 是 相等 的 , 那么 在 7 场 比赛 
5 场 比赛 才能 决 出 胜 负 ( 即 其 中 一 队 赢得 4 场 比赛 ) 的 概率 是 多 少 ? 恰好 用 5 


出 胜 负 的 概率 是 多 少 ? 
在 小 于 或 等 于 100 的 正 整 数 中 , 不 能 被 2、3 或 11 整除 的 数 有 多 少 个 ? 


习题 5.5.2 
习题 5.5.3 


证 明 : 当 一 co 时 , 从 {1,2,3,… ,n} 中 随机 取出 


P, 至 少 要 进 


的 一 个 正 整数 是 一 个 完全 


行 
决 


少 要 
场 比赛 


忆 


方 数 的 概率 趋 近 于 0. 更 进一步 , 如 果 把 “完全 平方 数 ” 替换 成 “素数 ”, 结果 又 如 何 ? 
习题 5.5.4 “对 编号 为 1 ~ 10 的 10 个 不 同 对 象 进行 排列 . 使 得 5 号 不 在 前 2 个 位 置 上 , 日 


10 号 不 在 最 后 2 个 位 置 上 的 排列 方法 有 多 少 种 ? 


习题 5.5.5 


利用 容 斥 方法 来 计算 , 如 果 拿 到 的 5 张 牌 中 至 少 有 一 张 A, 那么 这 样 的 5 张 牌 


法 则 和 对 立 事件 法 则 来 解答 


共有 多 少 种 . 你 要 确定 事件 A; 应 该 代表 什么 . 不 要 用 全 概率 


(但 你 可 以 用 它们 来 检验 答案 ). 


习题 5.5.6 


容 斥 方法 最 伟大 的 应 用 之 一 是 计算 挛 生 素数 的 倒数 


和 ; 有 不 同人 处 型 


1! 器 的 计算 


机 给 出 了 不 同 的 结果 , 它们 之 间 的 差异 导致 了 英特尔 奔腾 处 


里 器 bug 的 发 现 ， 


这 给 英 特 


尔 公司 带 来 了 巨大 的 财务 损失 . 阅读 与 之 相关 的 内 容 ([Nil, Ni2] 是 个 不 错 的 开始 ), 并 写 


个 短评 . 


习题 5.5.7 


假设 教室 里 有 20 名 学 生 . 第 一 天 , 教授 打算 让 学 生 们 两 两 握手 并 彼此 


习题 5.5.8 


20! Es 
10!.210 


那么 一 共 要 进行 多 少 次 握手 ? 


而 我 们 只 需要 考察 所 有 可 能 的 配对 方法 就 行 了 . 沿 着 这 种 
654 729 075, 但 是 这 个 值 远 高 于 实际 结果 . 这 个 论 说 


自我 介绍 ， 


在 上 一 个 习题 中 , 我 们 很 容易 认为 , 相互 介绍 的 次 数 等 于 把 20 名 学 生 分 成 10 对 


的 方法 数 ， 这 是 因为 我 们 可 能 会 认为 , 把 学 生 两 两 分 组 ,然后 让 每 对 学 生 4 
J 


修 此 


思路 , 相互 介绍 的 次 数 就 等 于 
出现 了 什么 错误 ? 


在 接 下 来 


的 两 个 习题 中 , 考虑 带 有 4 个 圆 形 刻 度 盘 的 密码 锁 ; 只 有 当 所 有 刻度 盘 都 指向 唯 


一 密码 时 , 锁 才 能 打开 . 每 个 刻度 盘 上 的 数字 都 是 0 到 9. 


习题 5.5.9 
习题 5.5.10 


计算 可 能 的 密码 个 数 . 


如 果 把 距离 定义 为 , 4 个 刻度 盘 的 每 个 都 转 到 密码 


自我 介绍 ， 


位 置 所 移动 的 单位 长 度 之 和 


的 最 小 值 , 那么 求 出 一 组 随机 密码 与 真实 密码 之 间 的 平均 距离 . 


习题 5.5.11 


写 有 该 字母 的 珠子 有 很 多 个 (更 准确 地 说 , 写 有 同一 个 字母 的 珠子 超过 了 p 个 


假设 我 们 有 一 堆 珠子 , 并 且 每 颗 珠 子 上 都 有 一 个 字 


把 这 些 珠子 做 成 手链 ; 出 于 对 数学 的 喜爱 , 我 们 想 确 保 每 条 了 


这 里 的 p 是 素数 . 那么 可 以 做 多 少 条 不 同 的 手链 ? 


习题 5.5.12 
习题 5.5.13 


有 nn 个 顶点 的 不 同 简单 图 有 多 少 个 ? 


习题 5.5.14 


利用 上 一 题 的 结果 来 证 明 费 马 小 定理 : az = a (mod p), J 


母 . 对 于 每 一 个 不 同 的 字母 
). 我 们 想 
FE 链 上 都 有 p 个 不 同 的 珠子 ， 


如 果 每 条 边 都 是 无 向 的 ( 即 给 定 顶点 a 和 6, 边 (ob 等 价 于 边 (b,a)), 那么 具 


其 中 a 是 整数 , p 是 


如 果 每 条 边 都 是 有 向 的 ( 即 给 定 顶点 a 和 b, 边 (ob 与 边 (6,a) 不 同 ), 那么 


n 个 顶点 可 以 构造 多 少 个 不 同 的 图 ? 
习题 5.5.15 ”顶点 a 的 度 , 记 作 d(a), 等 于 与 该 点 相连 的 边 的 个 数 . 每 个 环 计 算 两 次 . 证 明 : 
对 于 顶点 为 a1,a2,… ,an 的 图 , 有 > de) 二 2E, 其 中 是 图 中 所 包含 的 边 的 个 数 . 
习题 5.5.16 ”在 图 论 中 , 最 著名 的 问题 之 一 是 旅行 推销 员 问 题 : 在 给 定 一 组 城市 后 , 旅行 推 
销 员 能 确保 至 少 拜 访 每 个 城市 一 次 的 最 短 行程 是 多 少 ? 在 实践 中 , 这 个 优化 问题 很 难 找 
到 答案 . 使 得 ”个 城市 中 的 每 一 个 都 恰好 得 到 一 次 拜访 的 可 能 路 线 有 多 少 种 ? 
习题 5.5.17 ” 容 斥 公式 给 出 了 一 个 精确 的 表达 式 , 它 用 交集 概率 的 和 与 差 来 表示 并 集 的 概率 . 
证 明 : 如 果 在 一 个 正 项 之 后 ( 即 在 加 了 一 项 之 后 ) 我 们 截断 了 交集 的 “和 - 差 ” 表 达 式 , 那 
么 这 样 就 会 得 到 并 集 概率 的 一 个 上 界 ; 同样 地 , 证 明 : 如 果 在 一 个 负 项 之 后 ( 即 在 减 去 一 
项 之 后 ) 截断 交集 的 “和 - 差 ” 表 达 式 , 那 就 会 得 到 并 集 概率 的 一 个 下 界 . 这 是 一 个 非常 重 
要 的 结果 , 因为 它 可 以 让 我 们 得 到 概率 的 上 下 界 . 在 实践 中 , 公式 后 面 的 各 项 可 以 忽略 不 
讨 : 
习题 5.5.18 ”如 果 被 重新 排列 的 对 象 趋 近 于 无 穷 多 个 , 那么 至 少 有 一 个 对 象 回 到 初始 位 置 的 
概率 是 多 少 ? 有 一 半 对 象 回 到 了 初始 位 置 的 概率 是 多 少 ? 
习题 5.5.19 ”让 8 个 人 (4 位 妻子 和 她 们 的 4 位 丈夫 ) 围 成 一 圈 有 多 少 种 方法 ? 假设 只 需要 
基 虑 相对 次 序 , 并 且 所 有 妻子 都 不 相 邻 , 所 有 丈夫 也 不 相 邻 . 
习题 5.5.20 ”让 8 个 人 (4 位 妻子 和 她 们 的 4 位 丈夫 ) 围 成 一 圈 有 多 少 种 方法 ? 假设 只 需要 
劳 虑 相对 次 序 , 并 且 每 对 夫妻 都 不 相 邻 . 
习题 5.5.21 ”考虑 一 张 正 n 边 形 的 桌子 , 在 每 个 顶点 处 都 有 一 个 座位 , 在 每 条 边 上 都 有 两 个 
座位 , 于 是 一 共有 3n 个 座位 . 如果 只 考虑 相对 次 序 , 那么 把 3n 个 人 安排 在 座位 上 有 多 
少 种 方法 ? 


由 


习题 5.5.22 ”考虑 一 张 有 7 个 座位 的 圆桌 . 如 果 只 考虑 相对 次 序 , 那么 m < n 个 人 围 坐 在 
桌 旁 有 多 少 种 方法 ? 如 果 不 能 马上 看 出 答案 , 那 就 试 试 和 mm 取 特 殊 值 的 情形 , 看 看 你 


能 和 否 找到 其 中 的 规律 . 
习题 5.5.23 ”对 {1,2,3,4} 进行 排列 , 有 两 个 数 仍 位 于 初始 位 置 的 排列 方法 有 多 少 种 ? 恰 有 
两 个 数 仍 位 于 初始 位 置 的 排列 方法 有 多 少 种 ? 至 多 有 一 个 数 仍 位 于 初始 位 置 的 排列 方法 
有 多 少 种 ? 
习题 5.5.24 nn 个 对 象 的 错 排 数 可 以 记 作 In. 证 明 弟 推 关系 In = (mn 一 了 )((n 一 1))(!(n 一 2)). 
(提示 :“ 故 事 证 明 法 ”的 确 是 个 不 错 的 选择 ! ) 
习题 5.5.25 ”编写 仿真 代码 来 验证 一 个 大 集合 的 错 排 概率 . 
习题 5.5.26 ”计算 当 n 取 不 同 值 时 n 个 物体 的 错 排 所 占 的 比例 , 并 对 这 个 值 如 何 收敛 到 它 
的 极限 进行 评注 . 
习题 5.5.27 ”编写 一 段 代 码 , 使 其 能 够 找到 “ 康 威 餐巾 问题 ”的 近似 答案 ; 另外 , 已 知人 们 会 
使 用 左 侧 餐 巾 的 概率 是 p, 并 且 有 mn 个 人 用 餐 . 
习题 5.5.28 ”假设 亚瑟王 、 他 的 妻子 格 温 娜 维尔 以 及 他 的 4 名 骑士 围 坐 在 一 张 圆桌 旁 . 如 果 
其 中 名 叫 兰 斯 洛 特 的 骑士 总 是 坐 在 格 温 娜 维尔 的 对 面 , 那么 他 们 有 多 少 种 坐 法 ? 
习题 5.5.29 ”人 带 着 相同 两 锌 的 5 个 人 来 到 了 一 家 餐厅 , 并 把 他 们 的 伞 放 在 一 个 壁橱 里 , 如 果 
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每 个 人 在 离开 时 都 随机 地 拿 走 一 把 伞 , 那么 所 有 都 没有 带 走 自己 的 伞 的 概率 是 多 少 ? 

习题 5.5.30 ”用 4 件 衬衫 、2 件 毛 衣 、3 条 短裤 、2 条 裤子 和 5 双 袜 子 可 以 搭配 多 少 套 不 同 
的 衣服 (每 种 衣物 只 取 1 件 )? 随机 搭配 的 一 套 衣服 适合 在 炎热 天 气 里 穿 (也 就 是 说 你 穿 
的 是 短裤 和 衬衫 ) 的 概率 是 多 少 ? 如 果 有 2 件 衬衫 和 1 件 毛衣 是 葛 色 的 , 有 2 条 短裤 和 
1 条 裤子 是 红色 的 , 那么 随机 搭配 的 一 套 衣服 要 么 有 蓝 色 上 装 , 要 么 有 红色 下 装 , 但 不 可 
能 两 者 省 有 的 概率 为 多 少 ? 

习题 5.5.31 ”给 出 1 到 10 这 10 个 数 , 并 对 它们 进行 排列 ; 使 得 每 个 偶数 都 位 于 第 偶数 个 位 
置 上 的 排列 有 多 少 种 ? 
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雷 伊 ” 斯 坦 博士 : 你 说 的 选择 是 什么 意思 ?我 们 不 明白 . 
咏 萨 : 选择 . 选择 毁灭 者 的 形式 . 


一 《 捉 鬼 敢死队 》(1984) 


为 了 解决 计数 问题 , 我 们 引入 了 许多 强大 的 函数 和 技巧 : 从 阶乘 函数 和 二 项 式 
系数 到 容 斥 方法 . 在 本 章 中 , 我 们 将 利用 它们 来 解决 更 多 问题 . 在 概率 论 中 , 存在 着 
无 穷 无 尽 的 计数 问题 . 从 长 期 来 看 , 这 是 好 事 ; 因为 你 看 到 的 情况 越 多 , 就 越 能 更 好 


地 认识 到 在 以 后 的 课程 或 现实 世界 中 该 做 些 什么 . 


然而 , 从 短期 来 看 , 这 是 个 真正 的 挑战 . 有 时 , 我 们 看 不 出 那些 贯穿 于 所 有 练习 


的 常见 主题 . 本 章 的 目标 就 是 提醒 大 家 关注 这 些 常 见 主题 . 我 们 


已 经 看 到 了 如 何 解 


决 大 量 不 同 的 问题 . 这 里 将 引入 另外 一 些 热点 问题 , 像 之 前 那样 强调 它们 与 前 面 那 


些 问题 的 相同 之 处 , 并 解释 它们 有 哪些 新 变化 . 


显然 , 任何 课程 都 无 法 涵盖 所 有 主题 , 但 书 的 优势 就 在 于 能 实现 这 一 点 . 你 应 


该 阅读 自己 特别 感 兴趣 的 内 容 (或 者 你 的 课程 涉及 的 主题 ). 这 里 的 内 容 与 本 书 的 


其 他 部 分 无 关 , 其 中 的 观点 在 将 来 却 是 无 价 的 . 就 个 人 而 言 , 我 
面 ( 它 是 上 网 搜索 “数学 谜 题 ” 所 得 到 的 最 热门 结果 之 一 ) 和 我 
是 基于 6.3 节 解 决 饼干 问题 所 采用 的 优美 思路 . 

下 面 是 对 本 章 问 题 的 简要 总 结 . 
。6.1 节 基 本 计数 : 6.1.1 节 和 6.1.2 节 的 题目 涉及 典型 


创建 的 数学 谜 题 页 
的 几 篇 研究 论文 都 


的 计数 问题 , 尤其 


是 在 考虑 次 序 时 ,以 及 考虑 如 何 处 理 某 些 项 被 排除 在 外 的 情况 时 . 在 6.1.3 


节 的 最 后 , 我 们 考察 了 有 放 回 抽样 和 无 放 回 抽样 ， 它们 会 产生 完全 不 同 的 


-EH 
结果 . 


6.2 节 单 词 排序 : 这 看 起 来 好 像 是 在 讨论 用 Mississippi 中 的 字母 可 以 构造 


多 项 式 系数 是 由 二 项 式 系数 推广 而 来 的 . 


出 多 少 个 不 同 的 单词 , 而 这 个 问题 的 解决 方案 却 与 一 个 最 重要 的 科学 问题 
有 关 ! 在 研究 这 些 问题 的 过 程 中 , 我 们 会 遇 到 多 项 式 系数 . 从 名 字 不 难看 出 ， 


6.3 节 划 分 : 在 本 章 的 最 后 , 我 们 将 讨论 划分 . 我 们 已 经 看 到 , 尽管 可 以 对 许 
多 问题 进行 必要 的 计数 , 但 我 们 并 不 希望 问题 因此 而 变 得 过 于 复杂 . 这 些 问 
题 都 有 优美 的 解决 方案 . 如 果 问 一 个 数学 家 什么 样 的 答案 是 好 的 , 那么 你 会 
经 常 听 到 优美 这 个 词 . 与 容 斥 原理 相似 , 我 们 会 看 到 , 正确 地 考察 问题 如 何 
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带 来 愉快 的 解决 方案 , 这 完全 绕 过 了 那些 让 人 头疼 的 烦琐 情形 . 
整体 而 言 , 第 三 部 分 是 最 重要 的 . 在 许多 课程 中 , 这 层 内 容 没有 用 到 计数 , 这 的 
确 非常 遗憾 , 因为 其 中 有 一 些 想法 非常 棒 . 


i 


6.1 基本 计数 


在 本 节 中 , 我 们 将 回 过 头 来 考察 一 些 基 本 的 计数 问题 . 重点 是 要 更 多 地 了 解 所 
有 情况 来 进行 练习 , 以 确保 考虑 到 了 所 有 的 可 能 性 , 不 会 遗漏 任何 东西 . 6.1.1 节 和 
6.1.2 节 的 问题 类 似 于 我 们 之 前 讨论 过 的 题目 . 6.1.3 节 的 问题 将 引入 新 的 内 容 , 即 
有 放 回 抽样 和 无 放 回 抽样 . 


6.1.1 枚 举 法 I 


对 于 很 多 问题 , 我 们 都 要 强调 在 计数 时 要 特别 小 心 . 下 面 这 个 问题 的 灵感 来 源 
于 我 多 年 的 汽车 旅行 经 历 , 那 时 还 没有 iPod. 

例 6.1.1 假设 汽车 里 有 一 台 CD 播放 机 , 可 以 放 入 6 张 CD. 如 果 把 它 设置 成 
随机 播放 的 模式 , 那么 在 播放 完 某 张 CD 上 的 一 首 歌 后 , 它 会 再 随机 选择 一 张 CD， 
而 且 每 张 CD 被 选中 的 概率 是 相等 的 (包括 当前 正在 播放 的 CD). 在 随机 模式 下 ， 
我 们 播放 了 10 首 歌曲 , 而 且 播放 机 里 放 满 了 6 张 CD. 那么 播放 机 选择 CD 的 方 
法 有 多 少 种 ?2 号、3 号 和 6 号 CD 都 没 被 选中 的 情况 有 多 少 种 ?也 就 是 说 , 我 们 没 
有 听 到 2 号、3 号 和 6 号 CD 上 歌曲 的 概率 是 多 少 ?假设 我 们 有 了 一 个 改进 的 随机 
播放 模式 , 它 不 会 连续 播放 同一 张 CD 中 的 两 首 曲子 . 现在 , 我 们 没有 听 到 2 号 、3 
号 和 6 号 CD 上 歌曲 的 概率 是 多 少 ? 

记 住 , 当 研究 这 样 的 问题 时 , 要 确保 在 选择 方法 之 前 先 理解 问题 . 在 读 问题 时 ， 
尔 应 该 想 一 下 是 否 需 要 考虑 次 序 . 

解答 当 我 们 第 一 次 把 CD 播放 机 设置 成 随机 播放 模式 时 , 它 有 6 张 CD 可 
以 选择 . 当 挑选 下 一 首 歌曲 时 , CD 播放 机 会 再 次 从 这 6 张 CD 中 随机 地 选 出 一 张 . 
因此 , 前 两 首 歌 的 CD 有 6.6 = 36 种 可 能 的 选择 . 每 次 播放 一 首 新 歌 时 , 播放 机 
都 会 随机 地 选 出 一 张 CD, 因此 可 能 的 结果 要 乘 以 6， 于 是 , 播放 10 首 歌 一 共有 
610 = 60 466 176 种 可 能 的 选择 . 注意 , 这 个 问题 要 考虑 次 序 : 如 果 只 随机 播放 两 首 
歌 , 那么 先 选 出 4 号 CD 然后 选 出 3 号 CD, 与 先 选 出 3 号 CD 后 再 选 出 4 号 CD 
是 不 一 样 的 . 

我 们 可 以 直接 算出 没有 选中 2 号 、3 号 和 6 号 CD 的 选 法 有 多 少 种 . 当 随 机 播 
放 第 一 首 歌 时 , 不 包含 2 号 、3 号 和 6 号 CD 的 选 法 只 有 3 种 : 即 选 中 了 1 号 、4 
号 或 者 5 号 CD. 每 次 选择 CD 时 , 播放 机 都 只 能 从 这 3 张 CD 中 选 , 那么 播放 10 
首 歌 都 不 属于 2 号 、3 号 和 6 号 CD 的 选 法 只 有 310 = 59 049 种 . 因此 , 不 会 选中 
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2 号 、3 号 和 6 号 CD 的 概率 就 等 于 和 和 6 = T1057; 略 低 于 0.1%. 

对 于 改进 的 随机 模式 , 我 们 会 得 到 不 一 样 的 结果 . 第 一 首 歌 选 自 6 张 CD 中 的 
一 张 ; 但 播放 下 一 首 歌 时 , 播放 机 不 会 从 刚刚 播放 的 CD 中 选 歌 , 所 以 现在 只 有 5 
张 CD 可 供 选择 . 因此 , 第 一 首 歌 的 CD 有 6 种 选择 , 剩 下 9 首 歌 的 每 一 首 歌 都 要 
从 5 张 CD 中 挑选 , 这 样 一 共有 6:59 = 11 718 750 种 可 能 的 结果 . 

为 了 求 出 不 从 2 号 、3 号 和 6 号 CD 中 选 歌 的 方法 有 多 少 种 , 第 一 首 歌 只 有 三 
种 可 能 的 选择 : 即 1 号 、4 号 或 者 5 号 CD. 但 是 , 第 一 首 歌 播 完 后 , 刚才 被 选中 的 
CD 就 不 能 用 来 挑选 第 二 首 歌 了 , 于 是 第 二 首 歌 不 从 2 号 、3 号 和 6 号 CD 中 选取 的 
方法 只 有 两 种 . 在 第 一 首 歌 之 后 , 每 次 选 歌 都 有 两 种 可 能 性 . 因此 , 不 会 播放 2 号 、3 
号 和 6 号 CD 的 可 能 结果 一 共有 3 29 = 1536 种 , 其 概率 为 -53 一 353055 
略 高 于 0.01%. 


6.1.2” 枚 举 法 II 


接 下 来 , 继续 考虑 一 个 限制 下 一 步 可 能 发 生 什么 的 例子 , 并 认真 做 好 记录 分 析 . 

例 6.1.2 ”试想 一 下 , 某国 的 汽车 牌照 是 按照 以 下 规则 建造 的 : 所 有 车 牌 都 以 
3 个 字母 开头 (每 个 字母 都 等 可 能 地 被 选中 ), 然后 是 3 个 数字 (每 个 数字 都 等 可 能 
地 被 选中 ), 如 图 6-1 所 示 . (1) 有 多 少 个 不 同 的 车 牌 ?(2) 假设 现在 不 允许 有 任何 元 
音字 母 (A、E、I、O 和 U) 和 任何 偶数 . 那么 一 共有 多 少 个 车 牌 ? (3) 对 于 两 个 车 
牌 , 在 6 个 字符 中 , 恰 有 4 个 字符 相同 的 概率 是 多 少 ? 


工人 AS 惟信 


Um870 
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图 6-1 一块 这 样 的 车 牌 ， 它 的 前 3 位 是 字母 且 后 3 位 是 数字 . 图 片 来 自 于 War (维基 百科 
用 户 ) 


我 们 采用 标准 方法 来 解决 问题 , 仔细 地 列举 出 所 有 可 能 性 . 在 阅读 解 题 方案 时 ， 
你 可 以 想 想 整 & 个 过 程 是 否 令 人 感到 愉快 ， 以 及 是 否 存 在 更 简单 的 解 题 方法 . 

(1) 的 解答 : 计算 有 多 少 个 不 同 的 车 牌 相对 比较 简单 . 因为 前 3 个 字符 都 是 字 
母 , 所 以 每 个 字母 都 有 26 种 可 能 的 选择 (从 A 到 2). 接 下 来 是 3 个 数字 , 每 个 数 


196 第 6 章 计数 III 高 等 组 合 学 


字 都 有 10 种 选择 (从 0 到 9). 于 是 , 在 这 些 限制 下 , 一 共有 26.26.26.10.10.10== 
17 576 000 个 可 能 的 车 牌 . 

(2) 的 解答 : 如 果 元 音字 母 和 偶数 都 不 能 出 现 , 那么 只 需要 修改 可 供 选 择 的 数 
量 就 能 重新 算出 车 牌 的 总 数 . 也 就 是 说 , 现在 只 有 21 个 字母 可 以 选择 , 而 不 是 26 
个 ; 另外 , 我 们 只 有 5 个 数字 可 选 , 而 非 10 个 . 这 样 一 共 得 到 了 21.21.21.5.5.5 一 
1 157 625 个 可 能 的 车 牌 . 

(3) 的 解答 : 6 个 字符 中 恰 有 4 个 字符 相同 (1 个 字符 就 是 车 牌 上 的 1 个 符号 ， 
也 就 是 说 , 它 既 可 以 是 3 个 数字 之 一 , 也 可 以 是 3 个 字母 之 一 ) 等 于 6 个 字符 中 恰 
有 2 个 字符 是 不 同 的 . 这 2 个 不 同 字符 所 在 的 位 置 有 (5) = 15 种 选 法 . 为 什么 ?我 
们 必须 从 6 个 位 置 中 选 出 2 个 , 这 正 是 二 项 式 系数 的 定义 . 因为 有 些 字符 是 数字 ， 
而 有 些 是 字母 , 并 且 备 选 数字 要 比 字母 少 很 多 , 所 以 我 们 会 分 情况 计算 . 把 每 种 情 
况 的 结果 都 加 起 来 , 就 到 了 6 个 字符 中 恰 有 4 个 字符 相同 的 2 个 车 牌 共有 多 少 种 

下 面 列 出 从 6 个 位 置 中 选 出 2 个 的 15 种 可 能 方法 : (1) 2 个 字母 : 第 1 个 和 
第 2 个, 第 1 个 和 第 3 个 , 以 及 第 2 个 和 第 3 个 ; (2) 2 个 数字 : 第 4 个 和 第 5 个 ， 
第 4 个 和 第 6 个 , 以 及 第 5 个 和 第 6 个 ; (3) 1 个 字母 和 1 个 数字 : 第 1 个 和 第 4 
个 , 第 1 个 和 第 5 个 , 第 1 个 和 第 6 个 , 第 2 个 和 第 4 个 , 第 2 个 和 第 5 个 , 第 2 
个 和 第 6 个 , 第 3 个 和 第 4 个 , 第 3 个 和 第 5 个 , 第 3 个 和 第 6 个 . 接 下 来 我 们 会 
看 到 , 在 每 一 种 情形 下 , 各 种 选 法 具有 相同 的 结果 . 在 阅读 下 列 分 析 时 , 请 记 住 以 下 
几 点 : 计算 两 个 车 牌 恰 有 4 个 相同 字符 的 概率 就 等 于 , 在 给 定 一 个 车 牌 的 前 提 下 ， 
计算 随机 选 出 的 第 二 个 车 牌 与 给 定 车 牌 恰 有 4 个 相同 字符 的 可 能 性 . 在 第 一 种 方 
法 之 后 , 我 们 将 看 到 这 种 理解 是 如 何 加 速 计 算 的 . 

。 首先, 假设 除了 第 1 个 和 第 2 个 位 置 上 的 字符 外 , 其 他 所 有 位 置 上 的 字符 
都 是 相同 的 . 不 失 一 般 性 地 , 我 们 先 选 出 一 个 车 牌 . 由 于 第 1 个 和 第 2 个 位 
置 上 都 是 字母 , 因此 前 2 个 位 置 共 有 26. 26 种 可 能 的 选择 . 我 们 必须 确保 第 
2 个 车 牌 在 这 2 个 位 置 上 的 字符 与 第 1 个 车 牌 的 不 同 . 因此 , 第 1 个 位 置 上 
有 25 个 字母 可 供 选 择 (因为 这 个 位 置 上 的 字母 必须 与 第 1 个 车 牌 的 不 同 ); 
同样 , 第 2 个 位 置 上 也 有 25 个 字母 可 供 选 择 . 现在 , 我 们 要 为 剩 下 4 个 位 置 
选择 字符 , 而 两 个 车 牌 在 这 些 位 置 上 的 字符 是 一 样 的 . 第 3 个 字符 有 26 种 
可 能 的 选择 (因为 我 们 必须 选 出 1 个 字母 ), 而 剩 下 的 每 个 字符 都 有 10 种 选 
择 (因为 它们 可 以 是 任意 一 个 数字 ). 把 上 述 结果 相 乘 , 那么 只 有 第 1 个 和 第 
2 字符 不 同 的 2 个 车 牌 共有 

262 . 252 . 26 . 103 = 10 985 000 000 
种 可 能 情况 . 对 于 前 2 个 字符 , 唯一 的 特别 之 处 在 于 它们 都 是 字母 . 当 只 有 
第 1 个 和 第 3 个 字符 不 同 或 者 只 有 第 2 个 和 第 3 个 字符 不 同时 , 我 们 会 
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得 到 相同 的 结果 ; 因此 , 除 2 个 字母 外 , 其 他 字符 全 都 相同 的 2 个 车 牌 的 可 
能 情况 是 上 述 结果 的 3 倍 , 即 32 955 000 000. 
现在 假设 除了 第 5 个 和 第 6 个 字符 外 , 其 他 字符 全 都 相同 . 记 住 , 这 2 两 个 
字符 都 是 0 到 9 的 某 个 数字 . 对 于 这 2 个 位 置 , 第 1 个 车 牌 有 10 . 10 种 可 
能 的 选择 , 而 第 2 个 车 牌 有 9.9 种 不 同 的 选择 . 前 3 个 字符 共有 263 种 可 
能 性 (在 这 些 位 置 上 , 2 个 车 牌 的 字符 是 相同 的 ), 而 第 4 个 字符 有 10 种 选 
择 . 于 是 , 2 个 车 牌 的 可 能 情况 有 
102 . 92 .263 . 10 = 1,423,656, 000. 
同样 的 逻辑 也 适用 于 第 4 个 和 第 5 个 字符 , 以 及 第 4 个 和 第 6 个 字符 的 
情况 , 因此 我 们 要 把 上 述 结果 乘 上 3 倍 ; 这 样 就 求 出 了 除 2 个 数字 外 , 其 他 
字符 全 都 相同 的 两 个 车 牌 共 有 4 270 968 000 种 可 能 情况 . 
。 最后, 假设 第 3 个 和 第 4 个 字符 是 不 同 的 . 第 3 个 字符 是 字母 ; 所 以 , 在 该 
位 置 上 , 第 1 个 车 牌 有 26 种 选择 , 第 2 个 车 牌 有 25 种 选择 . 同样 地 , 对 于 
第 4 个 字符 , 第 1 个 车 牌 有 10 种 选择 , 第 2 个 车 牌 有 9 种 选择 . 2 个 车 牌 的 
其 余 字 符 全 都 相同 ; 那么 , 剩 下 的 2 个 字母 有 262 种 选 法 , 剩 下 的 2 个 数字 
有 102 种 选 法 . 同样 , 第 3 个 和 第 4 个 字符 并 不 是 唯一 的 可 能 性 . 只 要 恰 有 
1 个 字母 和 1 个 数字 是 不 同 的 , 2 个 车 牌 就 会 有 15 210 000 种 可 能 结果 . 这 
样 的 情况 包括 : 第 1 个 和 第 4 个 字符 , 第 1 个 和 第 5 个 字符 , 第 1 个 和 第 
6 个 字符 , 第 2 个 和 第 4 个 字符 , 第 2 个 和 第 5 个 字符 , 第 2 个 和 第 6 个 
字符 , 第 3 个 和 第 5 个 字符 , 以 及 第 3 个 和 第 6 个 字符 . 所 以 , 把 结果 乘 以 
9 就 得 到 了 


9.26.25.10.9.262.102= 35 591 400 000 

种 可 能 结果 . 

把 不 同情 况 的 结果 加 起 来 , 恰 有 4 个 相同 字符 的 两 个 车 牌 共 有 72 817 368 000 
种 . 由 于 任 取 两 个 车 牌 共有 17 576 000? 种 可 能 性 , 因此 两 个 车 牌 恰 有 4 个 相同 字 
符 的 概率 就 等 于 0.023 571 9%. 

对 情况 (3) 分 析 了 这 么 久 , 有 必要 看 看 是 否 存 在 更 好 的 解 题 方法 . 我 们 能 做 哪 
些 尝试 ? 有 时 , 计算 对 立 事件 的 概率 会 更 容易 (或 者 计算 对 立 事件 发 生 的 次 数 ). 遗 
憾 的 是 , 这 里 的 对 立 事 件 是 “两 个 车 牌 有 0 个 、1 个 、2 个 、3 个 、5 个 或 6 个 相同 
的 字符 ”. 有 时 我 们 找 不 到 其 他 更 好 的 办 法 只 能 卷 起 袖子 , 坚持 下 去 . 

虽然 我 们 无 法 列举 出 上 述 所 有 可 能 的 情况 , 但 或 许 会 有 更 简便 的 计算 方法 . 利 
用 对 称 性 , 我 们 已 经 节省 了 不 少时 间 . 例如 ,“ 只 有 第 1 个 和 第 2 个 字符 不 同 ” 的 
结果 就 等 于 “只 有 第 1 个 和 第 3 个 字符 不 同 ” 的 结果 , 也 等 于 “只 有 第 2 个 和 第 
3 个 字符 不 同 ” 的 结果 . 另外 , 不 需要 同时 考虑 两 个 车 牌 , 可 以 先 给 定 一 个 车 牌 , 然 
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后 考察 与 给 定 车 牌 愉 有 4 个 相同 字符 的 第 二 个 车 牌 一 共有 多 少 种 . 为 了 更 加 明确 ， 
我 们 假设 给 定 的 车 牌 是 AAA000. 从 这 个 角度 考察 将 有 助 于 简化 代码 和 模拟 过 程 . 
下 面 是 一 些 进行 数值 模拟 的 代码 . 首先, 我 们 给 出 一 个 程序 , 它 可 以 生成 两 个 车 牌 
并 求 出 相同 字符 所 在 的 位 置 . 接 下 来 , 我 们 假设 第 一 个 车 牌 是 AAA000, 然后 对 需 
要 做 出 的 改变 以 及 节省 的 计算 量 进行 评价 . 


licensecheck[numdo_|] := Module[{}, 


count = 0; 
Print["Theory predicts ", 100. (72817368000) / (26°6 10°6), "%."]; 
For[n = 1, n <= numdo, n++, 
东 
numagree = 0; 
For[j = 1, j <= 3, j++, 
{ 
(* 用 1 到 26 来 表示 字母 *) 
(* 分 别 为 每 个 车 牌 各 选取 1 个 字母 . 如 果 相同 ， 那么 计数 器 numagree 加 1 *) 
(* 然后 ， 对 后 3 个 数字 做 同样 的 处 理 *) 
x = RandomInteger [{1, 26}]; 
y = RandomInteger[{1, 26}]; 
If[x == y, numagree = numagree + 1]; 
u = RandomInteger[{0, 9}]; 
V = RandomInteger[{0, 9}]; 


If[u == v, numagree = numagree + 1]; 
起 ; (* 结束 对 j 的 循环 *) 
If [numagree == 4, count = count + 1]; 


(* 下 面 几 行 输出 每 次 的 结果 *) 
(* 我 们 再 做 10% 的 抽样 *) 
If [Mod[n, numdo/10] == 0， 
{ 
Print["At ", 100. n/numdo, "percent, observe "， 
SetAccuracy[100. count/n, 5], "%."]; 
}]; 
站]; (* 结束 对 n 的 循环 *) 
Print["Observe percentage ", SetAccuracy[100. count/numdo, 5],"%."]; 


] 
运行 10 000 000 次 的 结果 如 下 : 
Theory predicts 0.0235719%. 
Observe percentage 0.0236%. 
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最 后 , 我 们 就 效率 发 表 一 些 看 法 . 由 于 概率 太 小 , 需要 进行 大 量 模拟 才能 得 到 
可 信 的 答案 . 换 名 话说, 因为 答案 太 接 近 于 0, 所 以 我 们 要 进行 很 多 次 试验 才能 
解 它 略 大 于 0 的 程度 . 幸运 的 是 , 我 们 能 轻松 地 选取 随机 数 ; 即便 在 飞 往 丹佛 的 
长 途 航 班 上 , 我 也 可 以 用 低 电 量 计算 机 在 169.9 秒 、238.8 秒 或 者 170.1 秒 内 运行 
10 000 000 次 (虽然 我 关闭 了 绝 大 部 分 程序 , 但 计算 机 里 正在 运行 的 其 他 程序 会 导 
致 运行 时 间 出 现 波动 ). 
不 失 一 般 性 地 , 假设 我 们 把 第 一 个 车 牌 固定 为 AAA000 (用 1 来 表示 A), 那么 
代码 可 以 做 出 下 列 修改 . 


x = RandomInteger[{1, 26}]; 


Ty 
. 


If[x == 1, numagree = numagree + 1]; 
u = RandomInteger[{0, 9}]; 
If[u == 0, numagree = numagree + 1]; 

注意 , 我 们 已 经 将 随机 变量 的 数量 减少 了 50%, 从 4 个 减少 到 了 2 个 . 虽然 还 
要 做 很 多 计算 , 但 运行 10 000 000 次 所 需 的 时 间 变 成 了 136.8 秒 、141.3 秒 和 136.4 
秒 . 如 果 不 考虑 较 长 的 运行 时 间 238.8 秒 , 那么 生成 两 个 车 牌 的 代码 大 约 需要 运行 
170 秒 , 而 只 生成 一 个 车 牌 大 约 需 要 139 秒 . 这 意味 着 现在 的 运行 时 间 约 为 之 前 的 
5/6, 节省 了 大 量 时 间 ! 


6.1.3 ”有 放 回 抽样 和 无 放 回 抽样 


我 们 考虑 下 面 的 罐子 问题 . 在 读 题 时 , 问 问 自己 题目 是 否 阐 述 清楚 了 , 或 者 它 
是 否 有 多 种 可 能 的 解释 . 

例 6.1.3 ”假设 我 们 有 4 个 锥 子 . 每 个 锥 子 里 都 有 100 颗 玻 璃 球 , 每 颗 玻璃 
球 都 是 紫色 或 金色 的 . 第 一 个 钠 子 里 惟有 10 颗 紫 色 的 玻璃 球 , 第 二 个 钠 子 里 恰 有 
30 颗 紫 色 的 玻璃 球 , 第 三 个 钠 子 里 恰 有 60 颗 紫 色 的 玻璃 球 , 而 最 后 一 个 钠 子 里 恰 
有 90 颗 紫 色 的 玻璃 球 . (1) 假设 我 们 从 第 一 个 钠 子 里 取出 了 5 颗 玻 璃 球 : 至 少 拿 
到 4 颗 紫 色 玻 璃 球 的 概率 是 多 少 ? (2)、(3) 和 (4) 分 别 对 其 他 3 个 钠 子 提出 上 述 问 
题 . (5) 如 果 我 们 随机 地 挑 出 一 个 锥 子 , 那么 从 这 个 锥 子 里 取出 的 5 颗 玻璃 球 中 , 至 
少 有 4 颗 玻 璃 球 是 紫色 的 概率 为 多 少 ? 

如 上 所 述 , 这 个 问题 太 含糊 , 无 法 解决 . 从 人 饶 子 里 取出 5 颗 玻璃 球 是 什么 意思 ? 
对 于 取出 的 这 5 颗 玻璃 球 , 我 们 是 逐次 取出 5 颗 , 还 是 先 取出 1 颗 , 记 下 它 的 颜色 ， 
接着 把 它 放 回 去 , 然后 再 取 第 2 颗 ? 一 点 儿 也 不 奇怪 , 这 两 种 方法 会 给 出 两 个 不 同 
的 答案 . 第 一 种 情况 被 称 为 无 放 回 抽 样 , 第 二 种 情况 被 称 为 有 放 回 抽样 . 我 们 先 描 
述 无 放 回 抽样 时 的 结果 , 然后 再 给 出 有 放 回 抽样 时 的 结果 . 在 很 多 问题 中 , 更 常见 
的 是 无 放 回 抽样 ; 不 能 重复 使 用 同一 个 数 的 彩票 就 是 个 很 好 的 例子 . 然而 , 有 时 我 
们 确实 需要 有 放 回 抽样 (例如 , 蒙特 卡 罗 积 分 的 抽样 点 ), 因此 这 两 种 抽样 方法 都 很 
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我 还 有 个 困惑 . 如 果 题目 给 的 信息 不 是 “第 一 个 铅 子 里 恰 有 10 颗 紫 色 的 玻璃 


球 ”, 而 是 “第 一 个 铅 子 里 有 10 颗 紫色 的 玻璃 球 ”, 那 该 怎么 解释 这 个 题目 ? 虽然 
第 二 种 叙述 有 些 模糊 , 但 即便 没有 明确 的 表述 , 我 们 也 总 是 假定 作者 的 意思 是 “ 恰 


有 ”. 把 “ 恰 有 ” 写 出 来 的 确 会 使 得 问题 更 加 兄长 , 却 完全 消除 了 造成 混淆 的 危险 . 


我 们 先 解决 无 放 回 时 的 问题 . 


无 放 回 时 , 对 (1) 的 解答 : 考虑 第 一 个 钢 子 , 它 里 面 有 10 颗 紫 色 的 玻璃 球 和 
90 颗 金色 的 玻璃 球 . 至 少 取出 4 颗 紫 色 玻 璃 球 的 方法 有 2 种 : 恰好 取出 4 颗 紫 色 


的 玻璃 球 和 1 颗 金 色 的 玻璃 球 , 或 者 取出 5 颗 紫 色 的 玻璃 球 . 我 们 把 每 种 情况 的 概 


率 都 加 起 来 , 从 而 得 到 至 少 取 到 4 颗 紫色 玻璃 球 的 概率 . 


首先 考虑 取出 5 颗 紫 色 玻 璃 球 的 情况 . 当 取 第 1 颗 时 , 一 共有 100 颗 玻 璃 
球 , 其 中 有 10 颗 紫 色 的 玻璃 球 可 供 选择 , 因此 概率 为 10/100. 一 旦 取出 了 
第 1 颗 业 色 的 玻璃 球 , 剩 下 的 99 颗 中 只 有 9 颗 是 紫色 的 . 第 2 次 取 到 1 颗 
紫色 玻璃 球 (已 知 第 1 次 取 到 的 是 1 颗 紫 色 的 玻璃 球 ) 的 概率 是 9/99. 对 于 
剩 下 的 3 颗 玻璃 球 , 它们 是 紫色 的 概率 分 别 为 8/98,7/97 和 6/96. 把 这 些 概 
率 相 乘 , 求 出 取出 5 颗 紫 色 玻 璃 球 的 概率 为 

10 9 8 7 6 3020 1 

100 99 98 97 96 9034502400 298760 


这 个 问题 还 可 以 从 另 一 个 角度 来 考察 : (3)/(2) (无 放 回 地 取出 5 颗 玻璃 
球 共 有 ("9") 种 方法 , 从 10 颗 紫 色 玻 璃 球 中 选 出 5 颗 有 (3) 种 方法 ). 
接 下 来 计算 取出 4 颗 紫 色 的 玻璃 球 和 1 颗 金 色 玻璃 球 的 概率 . 注意 , 存在 以 
下 5 种 可 能 情况 : 先 取出 1 颗 金色 的 玻璃 球 , 而 剩 下 的 4 颗 玻 璃 球 全 是 紫 
色 的 ; 金色 的 玻璃 球 是 第 2 次 取 到 的 , 而 其 余 4 颗 玻璃 球 全 是 紫色 的 ; 依 此 
类 推 . 我 们 必须 把 所 有 可 能 性 的 概率 都 加 起 来 . 首先 , 假设 第 1 次 就 取 到 了 
金色 的 玻璃 球 . 取出 1 颗 金色 玻璃 球 的 概率 是 90/100. 现在 馈 子 里 仍然 有 
10 颗 紫 色 的 玻璃 球 , 但 剩 下 的 玻璃 球 一 共 还 有 99 颗 , 所 以 第 2 次 取 到 紫色 
玻璃 球 的 概率 是 10/99. 按照 同样 的 推理 过 程 , 接 下 来 取出 紫色 玻璃 球 的 概 
率 分 别 是 9/98、8/97 和 7/96. 因此 可 以 算出 , 先 取出 1 颗 金 色 玻 璃 球 , 然后 
又 取出 4 颗 紫 色 玻 璃 球 的 概率 是 ; 
90 10 9 8 7 453 600 3 


100 99 98 97 96 9034502400 59752° 
现在 , 假设 这 颗 金 色 的 玻璃 球 是 最 后 一 次 取出 的 ， 对 于 前 4 颗 紫 色 玻 璃 
球 , 它们 的 概率 与 取 到 5 颗 紫 色 玻 璃 球 时 前 4 颗 玻 璃 球 的 概率 相等 ， 即 
10/100、9/99、8/98 和 7/97. 但 最 后 一 次 取 到 的 玻璃 球 不 是 紫色 的 , 而 是 从 
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90 颗 金 1 
后 一 个 


色 的 玻璃 球 中 取出 1 颗 . 因为 缸 子 里 只 剩 下 了 96 颗 玻 璃 球 ， 
概率 是 90/96. 把 这 些 概率 相 乘 , 就 得 到 了 

10 9 8 7 90 453 600 3 

100 99 98 97 96 9034502400 59 752- 
注意 , 这 与 先 取 出 1 颗 金 色 玻璃 球 的 概率 是 一 样 的 . 这 并 非 巧合 . 看 


所 以 最 


看 两 个 


乘积 的 分 母 : 它们 是 相同 的 , 因为 无 论 取 出 哪 一 颗 玻璃 球 , 饶 子 里 玻 
总 数 始终 会 减少 1. 在 分 子 上 , 因为 我 们 总 是 无 放 回 地 取出 1 颗 金 色 
球 和 4 颗 紫 色 的 玻璃 球 , 所 以 最 后 会 得 到 


于 乘法 是 可 交换 的 , 因此 我 们 总 


5 殉 二 59 a 
考察 该 计算 过 程 的 男 一 个 角度 是 ， 让 它 等 于 

机 355， 为 了 看 清楚 这 一 点 , 取出 4 颗 紫 色 玻 璃 球 有 (2?) 种 方法 ， 
颗 金 色 玻 璃 球 有 (3) 种 方法 而 从 100 颗 玻 璃 球 中 取出 5 颗 芯 
种 . 在 这 样 的 题目 中 , 我 们 很 容易 遗忘 结构 , 或 者 不 小 心 添加 一 些 
以 , 能 用 多 种 方法 来 解 题 是 非常 棒 的 . 种 方法 比较 长 , 但 
的 争议 较 小 . 我 们 考虑 了 5 种 不 同 的 次 序 ; 如 果 用 P 来 表示 取出 了 
色 的 玻璃 球 , 用 G 来 表示 取出 了 1 颗 金 色 的 玻璃 球 , 那么 这 5 种 
是 PPPPG, PPPGP, PPGPP, PGPPP 和 GPPPP. 我 们 要 把 这 5 种 
概率 都 计算 出 来 , 然后 相 加 . 对 于 第 二 种 方法 , 乘积 中 并 没有 出 现 由 
因 所 形成 的 (3) 这 个 因子 . 在 这 个 乘积 中 , 我 们 关心 的 是 (3)( 


征 
在 乎 5 颗 玻璃 球 取出 的 次 序 , 只 关注 取 到 了 4 颗 紫 色 玻 璃 球 和 1 颗 
璃 球 . 


第 
条 


(2)(7)/(5)， 也 


的 方法 有 ( 
5 内容. 所 
在 我 看 来 , 它 


璃 球 的 


色 的 玻璃 
相同 的 分 子 , 只 是 次 序 不 同 而 已 . 
\ 是 得 到 相同 的 结果 : 概率 3/59,752. 因为 


取出 1 颗 金色 玻璃 球 和 4 颗 紫 色 玻 璃 球 的 方法 一 共有 (3) = 5 种 (金色 玻璃 
球 在 第 1 次 、 第 2 次、 第 3 次、 第 4 次 或 第 5 次 取 球 时 被 取出 ), 所 以 要 把 上 


2 从 而 得 到 恰好 取出 4 颗 紫 色 玻 璃 球 的 概率 为 P(4 个 紫 球 ) = 


就 
取出 
0 


5 


1 颗 紫 


情况 分 别 
情况 的 
上 述 原 
1); 我 


全 


门 不 
色 玻 


正如 我 们 最 初 讨论 的 , 至 少 取出 4 颗 紫 


色 玻 璃 球 的 概率 就 等 于 恰好 取出 4 颗 或 


恰好 取出 色 玻 璃 球 的 概率 . 因 


此 , 至 少 取出 4 颗 紫 


色 玻 璃 球 的 概率 ; 


1 
为 298 760 


5 二 7, 或 约 为 0.025%. 
无 放 回 时 , 对 (2) 的 解答 
璃 球 和 70 颗 金 1 


个 车 丫 


色 的 玻璃 球 . 对 于 “取出 5 颗 紫色 玻璃 球 ” 的 概率 ， 
子 的 完全 相同 , 我 们 具 需 要 把 其 中 的 数 相应 地 替换 成 第 二 个 饶 


分 析 过 程 


出 5 颗 紫 色 玻璃 球 的 概率 就 是 
30 29 28 27 26 17100720 1131 
100 99 98 97 96 9034502 400 597 520° 


EA 


二 项 式 系数 , 我 们 会 得 到 (30) /(10), 它 与 上 述 结 果 相 等 


: 接 下 来 , 我 们 考察 第 二 个 缸 子 , 它 有 30 颗 紫 色 


色 的 至 
与 第 一 


子 的 数 即 可 . 取 
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同样 , 为 了 求 出 恰好 取出 4 颗 紫 色 玻 璃 球 的 概率 , 首先 计算 先 取 出 4 颗 紫 色 玻 
璃 球 , 最 后 取出 1 颗 金色 玻璃 球 的 概率 ; 
30 29 28 27 70 46 040 400 
100 99 98 97 96 9034 502 400° 
考虑 到 取出 4 颗 紫色 玻璃 球 和 1 颗 金色 玻璃 球 的 5 种 不 同 次 序 , 我 们 要 把 这 个 概 
率 乘 以 5, 从 而 得 到 了 5 58 80 53750 460; 也 就 是 7 大 如果 采用 二 项 
式 系数 的 方法 , 就 会 得 到 (30) (了)/(129). 与 前 面 的 问题 相似 , 这 里 没有 因子 (5) = 5 
是 因为 两 个 二 项 式 系数 的 乘积 已 经 给 出 了 所 有 可 能 情况 . 
最 后 , 把 恰好 取 到 4 颗 紫 色 玻 璃 球 和 恰好 取 到 5 颗 紫色 玻璃 球 的 概率 加 起 来 ， 


就 得 到 了 至 少 取 到 4 颗 紫 1 


色 玻 璃 球 的 概率 : 
17 100 720 230 202 000 247 302 720 C4089 
9034502400 9034502 400 9034502400 149 380’ 


或 约 为 2.74%. 


无 放 回 时 , 对 (3) 的 解答 
色 玻 璃 球 只 


: 对 于 第 三 个 
有 40 颗 . 取出 5 颗 紫 1 
60 59 58 57 56 


道子 , 现在 有 60 颗 紫 色 的 玻璃 球 , 而 金 


色 玻 璃 球 的 概率 是 


655 381 440 


100 99 98 97 96 一 
H 4 颗 紫 色 玻 璃 球 和 1 颗 金色 玻璃 球 的 概率 为 


恰好 取 昌 


60 59 58 57 40 4 


9 034 502 400 


68 129 600 _ 2 340 648 000 


4 颗 紫 
2 340 648 000 


5 (入 - 罗 - 芝 - 芝 名 
因此 , 从 这 个 饶 子 里 至 少 取 H 
655 381 440 


9 034 502 400 
色 玻 璃 球 的 概率 


9 034 502 400 


是 


2 996 029 440 260 072 


~ 9 034 502 400 
或 约 为 33.16%， 利 月 
(®) (A 


4)\1 5 
金色 的 玻璃 球 . 取 H 


无 放 回 时 , 对 (4) 的 解答 : 最 后 , 第 四 个 炙 子 里 有 90 颗 紫 


H 5 颗 紫 色 玻 璃 球 的 概率 
90 89 88 87 86 


9 034 502 400 一 
二 项 式 系 数 , 我 们 会 得 到 同样 的 答案 , 可 以 写成 ($)/(30) 十 


9 034 502 400 ”784 245， 


色 的 玻璃 球 和 10 颗 


是 


5 273 912 160 


100 99 98 97 96 一 


Sy 
~ 


取出 4 颗 紫 色 玻 璃 球 和 1 颗 
90 89 88 87 10 6 


色 玻 璃 球 的 概率 


9 034 502 400 


是 


13 245 600 3 066 228 000 


5 (区 -中 县 区. 吕 ) = 
因此 , 至 少 取出 4 颗 紫 色 玻 璃 球 的 概率 就 等 
5 273 912 160 ， 


“9 034 502 400 一 


3 066 228 000 


9 034 502 400 


8 340 140 160 43 877 


9034502 400 


9 034 502 400 一 


9034502 400 ”好 530， 
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或 约 为 92.3%， 利 用 二 项 式 系数 , 我 们 能 得 到 相同 的 值 , 只 不 过 写成 (20)/(100) 上 + 
人 

无 放 回 时 , 对 (5) 的 解答 : 为 了 求 出 从 随机 挑 出 的 一 个 久子 里 至 少 取出 4 颗 
紫色 玻璃 球 的 概率 , 我 们 只 需要 让 挑 中 某 个 包子 的 概率 乘 以 从 该 包子 中 至 少 取出 4 
颗 紫色 玻璃 球 的 概率 就 行 了 . 因为 每 个 包子 都 等 可 能 地 被 挑 中 , 所 以 每 个 鱼子 被 选 
中 的 概率 都 是 1/4. 为 了 求 出 这 个 概率 , 要 把 每 个 包子 被 选中 时 的 概率 都 加 起 来 ; 


Eee 779 919 /1 4089 \ /1 260072\ /1 43 877 
~ \4 3065902643/ \4 149380/ \4 784245/ \4 47 530 
~ 0.000 063 596 197 5 + 0.006 843 285 58 + 0.082 905 214 6 + 0.230 785 819 
~ 0.320 597 915, 


或 略 大 于 32.0597%. 
现在 解决 有 放 回 的 问题 . 这 意味 着 玻璃 球 是 逐个 取出 来 的 ; 每 取出 1 颗 玻 璃 球 ， 
都 会 把 它 记 录 下 来 , 然后 再 放 回 铅 子 里 , 接 下 来 才能 取 第 2 颗 玻璃 球 . 不 难看 出 , 这 
在 一 定 程度 上 简化 了 我 们 的 分 析 . 
有 放 回 时 , 对 (1) 的 解答 : 第 一 个 钠 子 里 有 10 颗 紫 色 玻 璃 球 和 90 颗 金 色 玻 
璃 球 . 在 有 放 回 的 情况 下 , 至 少 取出 4 颗 紫 色 玻 璃 球 的 方法 有 两 种 : 恰好 取出 4 颗 
紫色 玻璃 球 (和 1 颗 金 色 玻璃 球 ) 或 恰好 取出 5 颗 紫 色 玻 璃 球 . 
。 现 在 计算 取出 5 颖 紫色 玻璃 球 的 概率 . 在 100 颗 玻璃 球 中 , 紫色 玻璃 球 有 10 
颗 , 所 以 取 到 的 第 1 颗 玻璃 球 是 紫色 的 概率 为 10/100. 事实 上 , 由 于 每 颗 玻 
璃 球 都 要 被 放 回 去 , 因此 每 1 次 取 到 紫色 玻璃 球 的 概率 都 是 10/100. 于 是 ， 
取出 的 5 颗 玻璃 球 全 是 紫色 的 概率 就 等 于 
可. 强 . 引 - (二 ) = 1 
100 100 100 100 100 10 100 000 
。 然 后 计算 取出 4 颗 紫 色 玻 璃 球 和 1 颗 金 色 玻璃 球 的 概率 . 同样 地 , 这 里 的 分 
析 与 无 放 回 时 的 分 析 相 同 : 我 们 需要 考虑 这 个 金色 玻璃 球 是 在 第 1 次 、 第 2? 
次 、 第 3 次、 第 4 次、 还 是 第 5 次 取 球 时 被 取出 ; 但 这 些 事件 的 概率 是 相等 
的 , 所 以 可 以 将 其 中 1 个 概率 乘 以 5, 这 样 就 得 到 了 涵盖 所 有 可 能 性 的 概率 . 
不 失 一 般 性 地 , 假设 第 1 次 就 取 到 了 金色 的 玻璃 球 . 因为 一 共有 90 颗 
金色 的 玻璃 球 , 所 以 第 1 次 取 到 金色 玻璃 球 的 概率 就 是 90/100， 接 下 来 ， 
我 们 取出 了 1 颗 紫 色 玻 璃 球 . 由 于 第 1 颗 玻 璃 球 被 放 了 回去 , 所 以 现在 有 
100 颗 玻 璃 球 , 其 中 有 10 颗 是 紫色 的 , 那么 取出 1 颗 紫色 玻璃 球 的 概率 就 
是 10/100. 因为 第 2 颗 玻璃 球 也 放 了 回去 , 所 以 对 于 剩 下 的 3 颗 紫色 玻璃 
球 , 它们 的 概率 也 都 是 10/100. 于 是 , 先 取 出 1 颗 金色 的 玻璃 球 , 再 取出 4 
颗 紫 色 玻 璃 球 的 概率 就 是 


TS 


本 
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100 100 100 100 100 10 \10 100 000 

回忆 一 下 , 为 了 求 出 取 到 4 颗 紫 色 玻 璃 球 和 1 颗 金 色 玻 璃 球 的 概率 , 我 们 

必须 把 这 个 值 乘 以 5 (因为 (5) = 5, 也 就 是 说 , 取出 金色 玻璃 球 的 方法 有 5 

种 ), 这 样 就 得 到 了 5 00 000 到 1 000 一 20 0560. 
最 后 , 至 少 取 出 4 颗 紫 色 玻 璃 球 的 概率 就 是 恰好 取出 4 颗 或 恰好 取出 5 颗 紫 

色 玻 璃 球 的 概率 : 


i a 
100 000 20000 100000 50 000 
或 为 0.046%. 
有 放 回 时 , 对 (2) 的 解答 : 接 下 来 考察 第 二 个 铅 子 , 它 有 30 颗 紫 色 玻 璃 球 和 
70 颗 金色 玻璃 球 . 因为 这 里 的 分 析 与 第 一 个 铅 子 的 完全 相同 , 所 以 我 们 直接 考察 计 
算 . 现在 , 恰好 取出 5 颗 紫色 玻璃 球 的 概率 是 
30 30 30 30 30 - (3) - 243 
100 100 100 100 100 10 100 000 


取出 4 颗 紫 色 玻 璃 球 和 1 颗 金 色 玻璃 球 的 概率 是 : 


5 70 30 30 30 30 567 567 
100 100 100 100 100/ 100000 20 000° 


= 0.000 46， 


于 是 , 至 少 取 出 4 颗 紫 色 玻 璃 球 的 概率 就 等 于 
243 567 243 2835 3078 
P= 100000 + 20000™ 100000 + 100000 一 100000 一 0030 "3， 
或 约 为 3.078%. 
有 放 回 时 , 对 (3) 的 解答 : 继续 考察 第 三 个 铅 子 , 我 们 现在 有 60 颗 紫 色 的 玻 
璃 球 和 40 颗 金色 的 玻璃 球 . 取出 5 颗 紫 色 玻 璃 球 的 概率 就 是 
60 60 60 60 60 人 243 
100 100 100 100 100  \5/ ”3125 
从 这 个 镀 子 里 取出 1 颗 金色 玻璃 球 和 4 颗 紫 色 玻 璃 球 的 概率 为 


40 60 60 60 60\_ 。162 162 
100 100 100 100 100/ 3125 625° 


I 


因此 , 至 少 取出 4 颗 紫 色 玻璃 球 的 概率 就 是 
243 162 1053 


P= | 一 
3125 625 3125 


= 0.336 96, 
或 约 为 33.696%. 
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有 放 回 时 , 对 (4) 的 解答 : 最 后 , 考察 装 有 90 颗 紫色 玻璃 球 和 10 颗 金 色 玻璃 
球 的 第 4 个 饶 子 . 取出 5 颗 紫色 玻璃 球 的 概率 是 
90 90 90 90 90 /9\ 59049 
100 100 100 100 100 \10/ ~ 100000 
从 这 个 铅 子 里 取出 1 颗 金 色 玻璃 球 和 4 颗 紫 色 玻璃 球 的 概率 为 
/10 90 90 90 90\) . 6561 6561 
100 100 100 100 100/ ~ 100000 20000 
因此 , 从 第 4 个 炙 子 里 至 少 取出 4 颗 紫色 玻璃 球 的 概率 就 等 于 
_ 59049 ，6561 _ 91 854 
100 000 ”20 000 ”100 000 


= 0.918 54, 


或 约 为 91.854%. 

有 放 回 时 , 对 (5) 的 解答 : 为 了 计算 从 随机 挑 出 的 一 个 馈 子 里 至 少 取出 4 颗 
紫色 玻璃 球 的 概率 , 我 们 采用 与 无 放 回 时 同样 的 处 理 方法 . 每 个 铅 子 被 选中 的 概率 
都 是 1/4, 于 是 要 先 把 每 个 色 子 所 对 应 的 “至 少 取出 4 颗 紫 色 玻 璃 球 的 概率 ” 乘 以 
1/4, 然后 再 把 结果 加 起 来 . 


1 1 1 1 
P= |-.:0. 4 一 ' 0. 十 | 一 .0. 一 :0.918 54 
(G3 0.000 o) + (3 0030 78) (G3 0336 96) + (3 0918 54) 


~ 0.000 115 + 0.007 695 + 0.084 24 + 0.229 635 
~ 0.321 685, 


或 约 为 32.1685%. 


结束 了 这 么 长 的 计算 , 我 们 看 看 它 是 否 合理 . 接 下 来 的 讨论 是 为 了 强调 计算 机 
模拟 如 何 帮助 我 们 进一步 验证 答案 的 正确 性 . 注意 , 对 这 个 问题 的 两 种 解释 相当 接 
近 . 例如 , 无 放 回 抽样 时 , 至 少 取出 4 颗 紫色 玻璃 球 的 概率 是 32.0597%, 但 有 放 回 
样 时 , 这 个 概率 就 是 32.1685%. 两 个 结果 有 一 点 差别 , 但 这 是 合理 的 . 为 什么 ? 当 
无 放 回 抽样 时 , 取 到 紫色 玻璃 球 会 越 来 越 难 , 因此 至 少 取出 4 颗 紫 色 玻 璃 球 的 概率 
就 要 小 一 些 . 想象 一 个 荒 雇 的 极端 情形 , 在 100 次 抽取 中 , 我 们 希望 至 少 取出 91 颗 
紫色 玻璃 球 . 在 无 放 回 的 情况 下 是 不 可 能 做 到 这 一 点 的 , 在 有 放 回 的 情况 下 或 许 能 
够 做 到 (但 可 能 性 极 小 ). 

为 了 认识 到 这 一 问题 , 我 编写 了 一 段 简 短 的 Mathematica 代码 , 并 计算 了 在 这 
两 种 情况 下 至 少 取出 4 颗 紫 色 玻 璃 球 的 概率 . 计算 机 是 个 很 棒 的 工具 . 我 们 将 用 整 
个 第 25 章 来 讨论 如 何 编写 代码 来 研究 诸如 此 类 的 问题 . 对 于 每 种 情况 , 我 都 运行 
了 100 000 次 . 第 一 次 运行 时 , 我 发 现 (无 放 回 时 ) 至 少 取 出 4 颗 紫 色 玻 璃 球 的 概率 
是 32.289%, 略 高 于 (有 放 回 时 的 ) 概率 31.907%. 接 下 来 , 当 我 进行 了 100 000 次 


Tl] 


pp 入 
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模拟 后 , 结果 就 颠倒 过 来 了 ; (有 放 回 时 的 ) 概率 32.008% 略 小 于 (无 放 回 时 的 ) 概 
率 32.114%. 这 里 有 个 重要 的 启示 : 我 们 要 弄 清 楚 进 行 多 少 次 模拟 才能 确保 答案 的 
正确 性 . 在 讨论 标准 差 时 , 我 们 会 对 这 个 问题 展开 更 多 讨论 . 


marblecheck[num_] := Module[{}, 
countwith = 0; (* 计算 有 放 回 时 成 功 的 次 数 *) 
countwithout = 0; (* 计算 无 放 回 时 成 功 的 次 数 *) 
list = 他; (* 创建 列表 1，2，...，100 *) 
For[m = 1, m <= 100, m++, list = AppendTo[list, m]]; 
p[1] = .1; p[2] = .3; p[3] = .6; p[4] = .9; (* 概率 *) 
For[n = 1, n <= num, n++ (* 主 循环 *) 
{ 
(* 先 考察 有 放 回 ， 再 考察 无 放 回 的 情况 *) 
(* 随机 选取 1,2,3,4 *) 
(* 假设 随机 数 生成 器 使 用 x = RandomInteger[{1，,，4}]; *) 
x = Floor[4*Random[]] + 1; 
numgold = 0; (* 计算 金色 玻璃 球 的 个 数 *) 
For[i = 1, i <= 5, i++, 
If [Random[] > p[x], numgold = numgold + 1]]; 
If[numgold <= 1, countwith = countwith + 1]; 


(* 无 放 回 的 情况 更 难 一 些 *) 

y = Floor[4*Random[]] + 1; (* 随机 选取 1,2,3,4 *) 
numgold = 0; (* 将 金色 玻璃 球 的 计数 设置 为 0 *) 

templist = RandomSample[list，5]; (* 从 列表 中 选取 5 个 *) 
cutoff = Floor[p[y]*100]; (* cutoff 值 用 于 比较 *) 
numgold = 0; 

For[m = 1, m <= 5, m++, 

If [templist[[m]] > cutoff, numgold = numgold + 1]]; 


If [numgold <= 1, countwithout = countwithout + 1]; 
}]; (* 结束 对 n 的 循环 *) 


Print["Observed probability at least four purple (without 
replacement) 
is ", 100 countwithout/num 1.0, "% (32.0597 predicted)."]; 
Print["Observed probability of getting at least four purple (with 
replacement) is ", 100 countwith/num 1.0, "% (32.1685 
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predicted)."]; 
Print["Did ", num, " iterations."]; 


]; (* 结束 整个 模块 *) 


For[nn = 1, nn <= 5，nn++，(# 适用 于 各 种 量 级 的 代码 *) 


{ 
marblecheck[1i0“nn]; 
Print[" "]; 

} 


6.2 单词 排序 


在 纸牌 游戏 中 , 我 们 详细 地 讨论 了 各 种 牌 型 的 概率 . 这 里 有 个 不 错 的 相关 问题 : 
我 们 现在 有 一 个 单词 (通常 会 选用 Mississippi, 但 我 的 家 乡 Massachusetts 也 是 个 
不 错 的 选择 ), 而 不 是 一 副 牌 ; 要 考察 的 对 象 是 字母 , 而 不 是 拿 到 的 牌 型 . 下 面 是 
些 很 自然 的 问题 . 

。 利 用 一 个 由 nn 个 字母 组 成 的 单词 , 可 以 构造 出 多 少 个 包含 天 个 字母 的 单词 ? 
在 这 里 , 字母 的 次 序 很 重要 ; 但 在 Mississippi 中 , 我 们 无 法 把 第 1 个 s 与 第 

2 个、 第 3 个 和 第 4 个 s 区 分 开 . 

。 调整 上 述 问题 , 要 求 新 单词 至 少 包含 一 个 重复 的 字母 . 

。 更 进一步 , 我 们 要 求 其 中 至 少 包 含 一 个 连续 出 现 的 重复 字母 . 例如 , 假设 从 
baboon 这 个 单词 开始 , 我 们 想得到 一 个 包含 4 个 字母 的 单词 , 而 且 其 中 要 
有 一 个 连续 出 现 的 重复 字母 . 那么 , boon 这 个 单词 就 满足 我 们 的 要 求 , 因为 
两 个 o 是 连续 出 现 的 , 但 bono 就 不 行 , 因为 它 的 o 不 相 邻 . 

我 们 将 演示 如 何 解 答 这 样 的 问题 . 在 讨论 过 程 中 , 我 们 会 遇 到 多 项 式 系数 , 它 
是 由 二 项 式 系数 推广 而 来 的 . 

最 后 , 我 们 将 兑现 在 本 章 引 言 中 的 承诺 , 给 出 一 个 相关 应 用 . 几 百 年 前 , 科学 下 
究 的 方式 与 今天 不 同 : 在 完成 所 有 工作 并 做 好 相关 验证 之 前 , 人 们 常常 希望 把 自己 
述 自 
( 


局 


的 主张 与 结果 挂 钧 . 为 此 , 人 们 和 常 采用 的 方法 是 , 给 出 一 个 拉丁 语 变 位 词 来 
己 的 发 现 , 而 变 位 词 指 的 就 是 把 某 个 短语 的 字母 位 置 加 以 改换 所 形成 的 新 词 . 
住 , 在 17 世纪 , 大 多 数 科学 家 都 能 理解 拉丁 语 , 所 以 语言 方面 不 会 有 困难 . ) 
例如 , 胡 克 定律 指出 , 弹簧 的 张力 与 位 移 成 正比 . 通过 给 出 ceiiinosssttuv, 他 确 
立 了 自己 优先 发 现 该 理论 的 地 位 . 这 是 拉丁 语 短语 Ut tensio sic vis 里 字母 的 一 种 
排序 , 该 短语 的 意思 是 “延伸 越 长 , 力量 越 大 ”. 

假设 现在 你 有 ceiiinosssttuv, 用 这 些 字母 能 构造 出 多 少 个 短语 ? 突然 发 现 , 这 


记 
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个 话题 并 不 像 看 上 去 那么 俊 . 
6.2.1 ”排序 方法 数 


我 们 首先 考虑 所 有 字母 都 不 相同 的 简单 情况 , 然后 再 考察 更 一 般 的 情况 . 
考虑 单词 MAINE. 这 里 有 


造 出 多 少 个 包含 这 5 个 字母 的 
2 个 字母 有 4 种 选择 , 第 3 个 字母 有 3 种 选择 , 第 4 个 字母 有 2 种 选择 , 而 最 后 1 
个 字母 会 随 之 确定 下 来 . 所 以 , 我 们 会 得 到 120 个 可 能 的 单词 


5 个 字母 , 并 且 每 个 字母 都 只 出 现 1 次 . 我 们 能 构 


E 词 ? 能 构造 出 51 个 : 第 1 个 字母 有 5 种 选择 , 第 


现在 考察 MISSISSIPPI. 我 们 考察 MAINE 时 所 使 用 的 推理 方法 现在 行 不 通 
了 , 因为 当 交 换 2 个 $ 时 , 得 到 的 还 是 原来 的 单词 ; 但 由 于 MAINE 中 没有 重复 的 


字符 , 交换 其 中 任意 2 个 字母 都 会 产生 一 个 新 单词 . 


来 说 , 情况 还 是 很 


我 们 从 一 个 较 简 六 


的 单词 开始 , 它 只 有 1 个 重复 的 字母 : ALABAMA. 对 我 们 
乐观 的 , 因为 有 4 个 A, 而 


I 


他 字母 都 只 出 现 1 次 . 我 们 想 知 道 


可 以 构造 出 多 少 个 包含 这 7 个 字母 的 不 同 单词 . 如 果 我 们 考察 的 是 一 个 没有 重复 


字母 的 单词 , 那么 这 样 的 单词 有 7! = 5040 个 . 虽然 这 并 没有 解决 问题 , 但 是 提供 了 


一 些 有 价值 的 指导 : 我 们 知道 答案 会 小 于 5040. 


数学 家 最 大 的 特点 之 一 就 是 懒惰 . 这 看 起 来 可 能 很 奇怪 , 但 如 果 你 采用 了 一 种 


很 棒 的 偷懒 方式 , 那么 懒惰 也 是 件 好 事 . 数学 家 是 怎样 偷懒 的 ? 我 们 喜欢 把 新 问题 


简化 成 以 前 解决 过 的 问题 . 有 时 我 们 可 以 完美 地 做 到 这 一 点 , 但 更 多 时 候 需 要 做 出 


一 些 调整 . 


假设 我 们 考察 的 单词 是 AlLAz>BAsMA4, 而 不 是 ALABAMA. 这 里 对 A 设置 


了 下 标 . 我 们 添加 了 结构 , 现在 就 可 以 区 分 不 同 的 A 了 .， 那么, 对 这 个 单词 的 5 
母 进行 重新 排列 共有 7! 种 方法 ; 但 是 , 在 原来 的 问题 中 , 需要 考虑 的 是 A 的 相对 
位 置 , 而 不 是 每 个 A 分 别 位 于 哪个 位 置 . 因此 , 我 们 不 希望 把 A3MLA2BA1A4 和 


A4MLA1BAoA3 看 成 


I 


个 不 同 的 单词 , 因为 我 们 感 兴趣 的 是 可 以 区 分 的 单词 . 


重要 的 是 哪些 位 置 上 有 A， 


个 A, 所 以 把 它们 有 序 ] 


而 不 是 在 茶 个 位 置 上 可 以 放 哪 些 A. 我 们 一 共有 4 


地 放 入 4 个 给 定位 置 的 放 法 有 4! 种 . 因此 , 我 们 多 计算 了 一 


个 因子 4!, 那么 包含 ALABAMA 这 7 个 字母 的 不 同 单词 一 共有 7!/4! = 210 个 , 远 


少 于 5040. 


我 们 有 必要 而 


完 一 下 上 述 解决 方案 . 这 里 采用 了 对 A 进行 区 分 的 方法 , 它 把 问 


单词 ) 


题 简 化 成 了 我 们 可 
法 有 4 种 , 所 以 必须 除 以 4 (因为 一 旦 去 掉 了 标记 , 所 有 标记 方法 都 会 产生 同一 个 


这 个 问题 还 可 以 从 另 一 个 4 


以 解决 的 情形 . 接 下 来 , 还 要 把 区 分 标记 去 掉 . 把 A 区 分 开 的 方 


和 度 来 考察 . 我 们 有 7 个 字母 : 4 个 A 和 3 个 非 A 


的 字母 (每 个 非 A 字母 都 只 出 现 1 次 ). 从 7 个 位 置 中 选 出 4 个 来 放置 A, 一 共有 
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(7) 种 方法 . 把 其 余 的 3 个 字母 分 别 放 入 剩 下 的 3 个 位 置 , 共有 3! 种 方法 . 因此， 
ALABAMA 的 可 区 分 排列 共有 (人 ) .3! = 蕴 :3!= 71/4! 种 , 这 恰好 是 前 面 得 到 的 

现在 看 一 下 KANSAS. 我 们 先 把 它 变 成 KA1NS1A2S2， 现 在 所 有 字母 都 不 相 
同 , 那么 可 以 构造 出 6! = 720 个 不 同 的 单词 . 接 下 来 要 去 掉 A 和 S 的 下 标 . A 的 排 
列 方法 有 2! 种 , 而 S 的 排列 方法 也 有 2! 种 . 因此 , 由 这 6 个 字母 组 成 的 不 同 单词 
共有 漠 ; 种 , 即 180 种 . 

利用 二 项 式 系数 , 我 们 可 以 得 到 相同 的 答案 , 但 过 程 要 更 复杂 些 . 从 6 个 位 置 
中 选 出 2 个 来 放置 A 的 方法 有 (9) 种 . 现在 还 剩 下 4 个 位 置 ; 从 这 4 个 位 置 中 选 
出 2 个 来 放置 $, 共有 (2) 种 方法 . 最 后 , 还 剩 下 2 个 位 置 和 2 个 不 同 的 字母 (它们 
既 不 是 A 也 不 是 S), 那么 安排 这 2 个 字母 的 方法 有 2! 种 . 综 上 所 述 , 一 共 构 造 出 


6\ /4 6! 4 6! 
2 
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个 不 同 的 单词 , 这 与 前 面 的 结果 恰好 相等 . 

KANSAS 是 一 个 长 度 较 小 的 单词 , 我 们 可 以 轻松 地 列举 出 这 2!2! 种 可 能 情况 . 
看 一 下 A1INKS1A2S2 这 个 有 序 单词 ， 当 交换 2 个 A 的 次 序 或 2 个 S 的 次 序 时 ， 
(去 挤 下 标 后 的 ) 单词 没有 发 生 任 何 变 化 ， 于 是 , A1NKS2A2S1、A2NKS1A1S。 和 
ANKS>A1S, 就 是 同一 个 无 下 标 单词 ANKSAS, 所 以 必须 把 有 下 标的 单词 总 数 6! 
除 以 2!21. 

现在 , 我 们 来 考察 一 种 “更 好 ”的 情况 . (至 少 相对 于 这 些 问 题 来 说 , 是 更 好 的 ! ) 

现在 是 时 候 考 察 MISSISSIPPI 了 , 它 是 该 理论 中 最 棱 的 情形 之 一 . 这 里 有 3 个 
不 同 的 字母 , 它们 都 出 现 了 不 止 一 次 ; 有 2 个 P、4 个 I 和 4 个 S$, 还 有 只 出 现 1 次 的 
字母 M. 和 以 前 一 样 , 我 们 对 字母 进行 标记 , 并 把 单词 记 作 MI1S1S212S3S4aI3P1P2I4. 
由 于 所 有 的 字母 都 不 相同 , 所 以 一 共有 11! 种 排列 方法 . 接 下 来 , 我 们 要 把 标记 去 掉 . 
先 看 看 4 个 S. 一旦 从 11 个 位 置 中 选 出 了 放置 $ 的 4 个 位 置 , 这 些 被 标记 的 
S 就 有 4 种 放置 方法 . 去 掉 标 记 后 , 这 些 放置 方法 都 是 一 样 的 , 所 以 我 们 多 乘 了 一 
个 因子 4; 要 想 去 掉 $ 的 下 标 , 必须 让 11! 除 以 4 

I 的 情况 如 何 呢 ? 它 的 处 理 方 式 与 $ 相同 . 一 旦 我 们 选 出 了 放置 工 的 4 个 位 置 ， 
这 些 被 标记 的 I 就 有 4! 种 排列 方法 . 因为 我 们 不 关心 哪个 工 被 放置 在 哪里 , 所 以 现 
在 要 把 标记 去 掉 . 不 难看 出 , 对 于 11!/4! 个 单词 , 我 们 在 计算 时 多 乘 了 一 个 因子 4. 
于 是 , 去 掉 S 和 了 的 标记 后 , 单词 的 总 数 为 11!1/(4!4!). 

我 们 距离 答案 已 经 很 近 了 . 现在 继续 处 理 P. 按照 同样 的 道理 , 对 于 11!/(4!41) 
个 单词 , 我 们 在 计算 时 多 乘 了 一 个 因子 2!, 所 以 上 述 结果 必须 除 以 2!. 于 是 , 我 们 得 
到 了 最 终 答案 : 由 MISSISSIPPI 可 以 构造 出 11!1/(4!4!2!) = 34 650 个 不 同 的 单词 . 
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种 选 法 . 接 下 来 , 从 剩 下 的 7 个 位 


现在 , 从 二 项 式 系数 的 角度 出 发 , 重新 考虑 上 述 问题 . 放置 $ 的 4 个 位 置 有 (21) 
置 中 选 出 4 个 来 放置 


L 共有 (?) 种 方法 . 继续 进 


行 下 去 , 从 剩 下 的 3 个 位 置 中 选 出 放置 P 的 2 个 位 置 共 有 (3) 种 方法 . 那么 , 把 M 


放 入 剩余 位 置 的 方法 只 有 (1) 种 . 把 上 述 结果 相 乘 , 我 们 得 到 了 


3! 1! 


11! 
= 34 650, 


OO 


4171 4131211! 1 
这 与 前 面 的 结果 相等 ! 


有 助 于 胡 


充当 了 重要 的 占 位 符 , 并 日 


虽然 因子 1 不 会 对 乘法 运算 产生 任何 影响 , 但 是 有 必要 把 它 写 出 来 . 原因 是 它 
人保 我 们 没有 遗漏 东西 . 在 上 述 问题 中 , 注意 


11! 4141211! 


分 


母 上 的 数 (4、4、2 和 1), 它们 加 起 来 就 等 于 分 子 上 的 数 (11); 这 并 非 巧 合 . 


我 们 可 以 为 这 类 问题 总 结 出 一 个 公式 . 


不 同 的 重 排序 ， 考察 一 个 长 度 为 N 且 包 含 
母 出 现 了 mi 次 , 第 
入 11 十 … 十 7 一 N). 于 是 ， 一 共 可 以 构造 


2 个 字母 出 现 了 nz 次 …… 
H NI/(mal.…nx!) 个 不 同 的 音 


k 个 不 同 字 母 的 单词 . 设 第 1 个 字 
第 个 字母 出 现 了 nx 次 ( 那 
词 . 


利用 上 面 这 个 公式 , 我 们 看 到 , 长 度 为 13 


的 单词 MASSACHUSETTS 可 以 构造 


出 131/(4!12!2!) = 64 864 800 个 不 同 的 单词 . 这 里 的 不 同 字母 分 别 是 A、C、E、H、M、 
S 工 和 TU, 它们 出 现 的 次 数 分 别 是 2、1、1、1、1、4、2 和 1; 


因为 1! 等 于 1, 所 以 


我 们 通常 不 在 除法 中 写 出 1!, 但 应 该 把 它 看 作 一 个 占 位 符 : 131/(2!1!11111!4!2!11!). 同 
样 , 注意 分 母 上 的 数 (2、1、1、1、4、2 和 1) 加 起 来 就 等 于 分 子 上 的 数 (13). 


6.2.2 ”多 项 式 系数 


在 学 会 成 功 地 计算 单词 个 数 的 基础 上 , 我 们 对 二 项 式 系数 进行 一 个 不 错 的 推 


广 


N) 的 非 负 整数 . 那么 多 项 式 系数 就 是 


11)722) ……，) 7 天 


多 项 式 系数 : 设 NN 是 一 个 正 整 数 , 上 且 ma,na，: 


72117221 Np! 


N! 


与 往常 一 样 , 当 我 们 推广 一 个 已 知 概念 或 定义 时 , 首先 要 做 的 就 是 看 它 在 特殊 


情况 下 能 和 否 退化 成 原来 的 概念 . 我 们 考察 K 


2 的 情形 . 此 时 ， 1 十 72 一 N, 也 就 


是 说 na = V 71) 


N! 


N! 


ni1ln2! 


Cs 


nil(N— ni)! 本 
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因此 , 当天 = 2 时 , 多 项 式 系数 就 是 二 项 式 系数 . 
没 错 , 多 项 式 系数 推广 了 二 项 式 系数 . 这 对 我 们 有 什么 帮助 呢 ? 回 想 一 下 , 二 
项 式 系 数 是 通过 展开 多 项 式 得 到 的 : 


N 


(z 十 外” = >》， 加 


n=0 


我 们 可 以 把 它 看 作 在 (z +y) 的 展开 式 中 , z*yN-" 出 现 了 (Y) 次 . 一 个 很 好 的 解 
释 是 , 在 NN 个 因子 中 , 恰好 有 n 个 因子 是 z, 那么 剩 下 的 N 一 n 个 因子 就 只 能 是 y. 

如 果 是 (z 十 yy 十 z) 六 ,情况 又 如 何 ? 如 果 把 这 个 式 子 展开 , 我 们 会 得 到 形 如 
zn1ign"azna 的 表达 式 ， 此 时 一 定 有 0 < ni1,n2,ns < N, 原因 是 在 展开 式 中 不 存在 
比 N 大 的 容 (对 于 一 个 变量 ,， 如果 每 次 都 选取 它 ， 那么 该 变量 的 窜 就 是 N), 也 
不 存在 比 0 小 的 过 (对 于 从 来 都 不 选取 的 变量 , 其 窜 就 为 0)， 然 而 , 还 有 一 个 事 
实 : ni 十 nz 十 n3 = V. 这 个 式 子 为 什么 成 立 ? 对 于 NN 个 因子 x 十 vy 十 z, 我 们 要 从 每 
因子 中 选 出 一 个 z、y 或 z, 所 以 一 共 会 选取 N 次 . 于 是 , 存在 整数 on wm 使 


太 他 


N 二 人 1，，22 ~ 人 3 
(Zz 二 +y++2z)”= > Gi 
OS<nin2o nagN 
n1it+n2+n3=N 


我 们 来 简要 地 证 明 an wons 等 于 多 项 式 系数 (;，， 让 ,,,). 一 种 方法 是 利用 我 们 
的 “懒惰 原则 ”. 还 记得 , 数学 家 的 懒惰 是 件 好 事 . 我 们 想 把 新 问题 简化 成 以 前 角 
决 过 的 问题 . 我 们 了 解 二 项 式 系数 和 二 项 式 定 理 , 所 以 这 个 更 一 般 的 问题 可 以 通过 
重复 利用 它们 来 解决 . 

关键 是 要 洞察 到 把 x 十 y 十 z 写成 x 十 (y 二 22); 现在 我 们 又 回 到 了 两 种 选择 : 选 
Zz, 或 不 选 x (当然 , 不 选 z 就 是 选择 (y 十 z)). 分 组 证 明 是 解决 各 种 问题 的 另外 一 
种 好 方法 . 在 A.3 节 中 , 利用 “两 个 函数 和 的 导数 就 是 两 个 导数 的 和 ”, 我 们 证 明了 
“三 个 函数 和 的 导数 就 等 于 三 个 导数 之 和 ”. 在 6.3.3 节 的 计数 问题 中 , 我 们 会 再 次 
看 到 这 种 方法 . 

根据 二 项 式 定理 , 我 们 有 


二 过 


N 


(otto = 5 (Tet om™, 


m1 一 0 


其 中 , 符号 m 是 z 被 选中 的 次 数 . 现在 再 次 使 用 二 项 式 定理 来 展开 (y 十 2): 
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把 这 两 个 式 子 结合 在 一 起 , 得 到 了 


N N—ni 
AN AN 一 
(Zz 十 y 十 2 六 二 > zr"! > 人 YZN nn2 
m= 人 和 2 一 0 2 
和 ed 


N N—ni 
2 
Nl N2 


ni nO 


N A 一 Nl 
ey 》 ( ee eA 
Og<ni,n2,n3&N a 2 


nitn2+n3=N 
最 后 一 行 把 已 经 得 到 的 结果 改写 成 了 更 简洁 的 形式 . 
剩 下 的 就 是 证 明 (Y) (w-m) 就 是 多 项 式 系数 (，Y ，), 其 中 ns = Nn 一 ng. 


nN1,N2,N3 
于 是 
NV/N-—nN) N! (NC—ni)! 
(%) ( nN2 ) nN ni)l nal(N— ni — no)! 
N! N! 
一 Niln2l(N — ni — n2)! 9 niln2lns!’ 


这 恰好 是 我 们 想 要 的 结果 ! 
对 一 般 情 况 的 证 明 也 是 如 此 . 假设 有 


(zi 十 za 十 …: 十 ZN)、. 


我 们 看 一 下 x?!222.…… 2 此 时 一 定 有 0 < ni,… ,ng 二 N 和 ni 二 nz 十 nk 二 NN. 
为 了 得 到 这 一 项 , 我 们 要 从 N 个 因子 中 选 出 m 个 (有 (Y) 种 选 法 ), 然后 这 ma 个 
因子 中 的 每 个 都 要 选 出 一 个 z1; 接 下 来 , 再 从 剩 下 的 NN 一 ni 个 因子 中 选 出 na 个 
(有 (~-m) 种 选 法 )， 而 这 na 个 因子 都 要 各 选 出 一 个 ms; 依次 进行 下 去 , 一 直到 最 
后 选 出 剩 下 的 mw 个 因子 (有 (ws] = 1 种 选 法 ), 然后 从 每 个 因子 中 选取 一 个 me. 把 
上 述 结果 相 乘 , 可 以 看 到 这 样 的 项 一 共有 


的 | ( 一 上 一 . 人 一 (7 和 | 


N! (NO—ni)! (NO— ni1— n2)! ng! 
nN—ni)lno(N oni ono) nal(N 一 01 一 ma — ns)! nxl!0! 


N! N! N 
一 niln2!l... ng!0! niln2l:.. :nx! 二 四 = 本 Re 
个 , 其 中 nx = NN 一 (ni 十 … 十 nxg?1). 
上 面 的 论述 告诉 我 们 多 项 式 系数 是 从 何 而 来 的 , 并 让 我 们 了 解 到 它 的 组 合 解 
释 . 最 后 一 个 式 子 的 分 子 是 N!, 而 分 母 是 大 个 和 为 Y 的 非 负 整数 ; 它 恰 好 是 我 们 
计算 不 同 单词 个 数 的 公式 . 
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6.3 划 分 


本 节 将 介绍 一 个 奇妙 的 视角 , 它 可 以 避免 组 合 问题 中 对 许多 烦琐 情形 的 分 析 . 
我 们 会 在 讨论 饼干 问题 时 看 到 它 , 并 在 最 后 阐述 它 在 彩票 方面 的 应 用 . 
6.3.1 ”饼干 问题 

下 面 描述 一 个 组 合 问题 , 它 包含 了 该 主题 的 许多 常见 特征 . 因为 我 们 的 陈述 中 
提 到 了 饼干 , 所 以 不 妨 把 它 称 为 饼干 问题 . 其 他 教材 会 采用 不 同 的 名 称 . 虽然 人 们 
党 把 这 个 问题 称 作 星星 和 隔 板 问题 (stars and bars problem), 但 我 更 喜欢 把 它 叫 作 
饼干 问题 , 因为 我 是 《4 芝麻 街 》 里 甜 饼 怪 (Cookie Monster) 的 超级 粉丝 , 如 图 6-2 所 
示 . 


图 6-2 作者 正在 讨论 饼干 问题 , 照片 由 Susmita Paul 提供 


不 多 说 了 , 现在 来 看 这 个 问题 . 假设 有 10 块 相 同 的 饼干 和 5 个 不 同 的 人 . 把 这 
10 块 饼干 全 部 分 发 给 这 5 个 人 的 不 同方 法 有 多 少 种 ? 

因为 饼干 都 是 一 样 的 , 所 以 我 们 无 法 分 辨 和 人们 都 拿 到 了 哪些 饼干 , 只 知道 每 个 
人 拿 到 了 儿 块 饼干 . 可 以 把 所 有 可 能 的 分 配方 法 列举 出 来 . 这 是 解决 棘手 问题 的 好 
策略 . 但 是 , 我 们 必须 非常 小 心 . 最 常见 的 一 个 错误 答案 是 519 = 9 765 625. 之 所 以 
得 出 这 个 结果 , 是 因为 人 们 的 着 手 点 是 每 一 块 饼 干 : 每 块 饼 干 都 可 以 分 给 5 个 人 中 
的 任意 一 个 , 所 以 第 1 块 饼干 有 5 种 选择 , 第 2 块 饼干 也 有 5 种 选择 , 等 等 . 但 问 
题 在 于 该 论述 隐 含 了 “饼干 是 不 同 ” 的 这 个 假设 . 第 1 个 人 拿 到 前 9 块 饼 干 且 第 2 
个 人 拿 到 第 10 块 饼干 , 与 第 2 个 人 拿 到 了 第 1 块 饼 和 干 且 第 1 个 人 拿 到 剩 下 的 9 块 
饼干 没有 任何 区 别 . 

现在 来 数 一 数 . 我 们 从 一 个 人 能 拿 到 的 最 多 饼干 数 入 手 . 让 一 个 人 拿 到 10 块 


本 
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Sm 


干 的 方法 有 5 种 . 5 个 人 中 一 
法 有 5.4= 20 种 . 我 们 还 可 以 于 
两 个 人 有 (3) 种 选 法 , 接着 对 他 1 
9 块 , 男 一 个 人 拿 到 了 1 块 ). 


个 人 拿 到 9 块 饼干 且 另 一 个 人 拿 到 一 块 饼干 的 方 
这 个 结果 看 作 (5)21, 而 不 是 5 .4; 能 拿 到 饼干 的 
站 进行 排序 的 方法 有 2! 种 (也 就 是 说 , 一 个 人 拿 到 


到 目前 为 目 , 计数 并 不 是 很 粳 糕 , 但 当 最 大 值 为 8 时 , 情况 就 不 一 样 了 . 一 个 
人 拿 到 8 块 饼干 且 另 一 个 人 拿 到 两 块 饼干 的 方法 有 5.4 种 , 但 是 现在 还 存在 男儿 
一 种 情况 : 有 一 个 人 拿 到 了 8 块 饼干 , 有 两 个 人 分 别 拿 到 了 一 块 饼干 . 对 于 这 种 情 


况 , 选 出 拿 到 8 块 饼干 的 人 有 5 种 方法 , 从 剩 下 的 四 人 中 选 出 拿 到 一 块 饼 干 的 两 个 


人 有 (3) = 6 种 方法 ; 因此 , 这 种 


按照 8、1、1 的 方式 来 分 配 饼 干 的 方法 共有 30 种 . 


我 们 也 可 以 从 二 项 式 系数 的 角度 来 考察 . 必须 从 5 个 人 中 选 出 拿 到 饼干 的 三 个 人 ， 


这 有 (3) 种 选 法 . 接着 要 对 这 三 个 人 排序 . 我 们 可 能 会 天 真 地 认为 答案 就 是 3!, 但 
要 记 住 饼干 的 分 配方 式 是 8、1、1. 因此 , 拿 到 一 块 饼干 的 两 个 人 是 不 作 区 分 的 (也 


就 是 说 , 他 们 都 拿 到 了 一 块 饼干 ， 


不 是 8 块 也 不 是 0 块 ). 所 以 , 这 里 必须 除 以 21, 那 


么 答案 就 是 (3)31/2! = 30. 如 果 态 记 除 以 21, 那么 就 多 乘 了 一 个 因子 2 (但 这 里 把 


它 看 作 2! 会 更 好 ). 依 此 类 推 下 去 . 


真正 的 难点 在 于 “ 依 此 类 推 
要 考虑 的 情况 就 会 越 来 越 多 ,只 


但 这 种 做 法 并 不 具有 启发 性 , 也 不 够 优美 . 


”. 当 一 个 人 能 拿 到 的 最 多 饼干 数 越 来 越 少时 , 需 
要 有 充足 的 时 间 且 足够 小 心 , 就 一 定 能 解决 问题 ， 


从 理论 上 看 , 我 们 能 解决 这 个 问题 , 但 在 实践 中 计算 会 变 得 难以 处 理 , 尤其 是 


当 饼 干 数 和 人 数 不 断 增加 时 . 换 


名 话说 , 我 不 想 把 这 个 过 程 写 出 来 , 即使 号 了 , 你 


可 能 也 不 想 读 下 去 ! 幸运 的 是 , 我 们 还 有 一 种 更 好 的 优美 方法 . 


同 的 方法 . 


饼干 问题 : 把 C 块 相同 的 饼干 全 部 分 发 给 P 个 不 同 的 人 , 一 共有 (“#57 ) 种 不 


P—1 


我 们 来 证 明 这 个 公式 . 假设 把 C+ 尸 -1 块 饼干 排 成 一 列 , 并 依次 编号 为 1 到 


C 十 一 1. 我 们 从 中 选 出 了 一 1 块 饼 干 ,有 (“#57 ) 种 选 法 这 正 是 二 项 式 系 
数 的 定义 . 甜 饼 怪 (原来 那个 无 拘 无 束 的 甜 饼 怪 总 想 着 吃 掉 饼 干 ) 会 帮助 我 们 把 这 


P 一 1 块 饼干 吃 掉 . 于 是 , 剩 下 的 饼干 分 成 己 组 : 被 甜 饼 怪 吃 掉 的 第 1 块 饼 干 之 前 
的 所 有 饼干 (这 些 饼干 都 分 给 了 第 1 个 人 ), 被 吃 掉 的 第 1 块 和 第 2 块 饼干 之 间 的 


所 有 饼干 (这 些 饼干 都 分 给 了 第 


2 个 人 ), 依 此 类 推 . 这 样 就 把 C 块 饼干 分 发 给 了 


忆 个 人 . 注意 , 不 同 的 PP 一 1 块 % 


干 对 应 着 把 C 块 饼干 划分 给 P 个 人 的 不 同方 法 ， 


并 且 每 种 分 配方 法 都 与 P 一 1 块 饼干 的 选取 有 关 , 从 直观 上 看 , 我 们 有 C 块 饼干 ， 
多 出 来 的 这 PP 一 1 块 “ 人 饼干 ”就 作为 分 配 饼 干 的 边界 . 于 是 , 在 选 出 这 PP 一 1 块 饼 
干 的 同时 , 剩 下 的 饼干 就 被 分 成 了 P 组 . 我 们 必须 先 加 上 P 一 1 块 不 被 分 发 的 “从 


干 ”, 而 那些 被 分 发 的 饼干 总 数 必须 等 于 C. 


SS 
分 


6.3 划 


举 个 例子 , 假设 有 10 块 饼干 和 5 个 人 ; 我 们 从 10 十 5 一 1 块 饼 干 中 选 出 第 3 


块 、 第 4 块 、 第 7 块 和 


第 13 块 饼 干 作为 边界 : 


DOOOOIOOOIIIHD 


这 意味 着 第 1 个 人 拿 到 了 2 块 % 


块 饼干 , 第 4 个 人 拿 到 


为 了 讲 得 更 清楚 , 假设 现在 有 8 块 名 
7 块 和 第 11 块 饼干 作为 边界 : 


选 出 第 4 块 、 第 


干 , 第 2 个 人 拿 到 了 0 块 名 


了 5 块 名 


干 , 而 第 5 个 人 拿 到 了 1 块 饼干 . 
干 和 4 个 人 . 我 们 从 8 十 4 一 1 块 饼 干 中 


干 , 第 3 个 人 拿 到 了 2 
和 


DODO Ge 


这 意味 着 第 1 个 人 拿 到 了 3 块 和 
块 饼干 , 而 第 4 个 人 拿 到 了 0 块 饼干 . 
现在 我 们 可 以 回答 最 初 的 问题 了 : 
有 (5 7) = (区 =1001 种 . 难 


十, 第 2 个 人 拿 到 了 2 块 名 


采用 的 密 力 枚 举 法 要 好 得 多 ! 


巴 10 块 饼干 全 部 分 发 给 5 个 人 的 不 同方 法 
以 置信 , 对 这 个 问题 的 解答 会 如 此 简单 . 它 比 之 前 


干 , 第 3 个 人 拿 到 了 3 


我 们 所 做 的 一 切 还 可 以 从 数论 的 角度 来 解释 . 考察 “划分 ”这 个 词 的 方式 有 两 
种 . 第 一 种 是 添加 划分 边界 , 第 二 种 是 对 数 N 进行 划分 . 把 10 块 名 


干 分 发 给 5 个 


人 的 问题 与 计算 方程 v1 十 x2 十 x3 十 XZ4 十 x5 = 10 有 多 少 个 解 是 一 样 的 , 其 中 , zx; 表 


示 第 i 个 人 拿 到 的 饼干 数 (所 以 xz; 是 个 非 负 整数 ). | 
方法 有 (2) = 1001 种 , 所 以 zi 十 … 十 zs = 10 共有 1001 个 非 负 整数 解 . 
一 个 相关 问题 及 其 解决 方案 . 如 果 考 虑 到 公 


我 喜欢 数论 的 解释 ， 


饼 


原理 可 知 ， 有 


效 的 分 配 


平 , 并 且 上 只 关心 每 个 人 至 少 分 到 一 块 饼干 的 分 法 , 那么 情况 又 是 怎样 的 ? 之 前 我 们 


要 求 x; > 0, 但 现在 就 要 让 zw > 1 了. 这 些 给 定 的 信 ， 


Yi 之 0. 于 是 , zi 十 … 十 x5 = 10, 其 中 zi > 1 就 可 以 改写 成 (y 


因 可 以 写成 zi = yi 十 1, 典 


中 
Fl) 十 … 十 (ys 二 1) 二 10 


日 y; > 0. 而 这 个 表达 式 就 等 于 yj 十 … 十 ys = 二 10 一 5 二 5 
束 条 件 的 唯一 作用 就 是 把 这 个 从 


个 但 


干 问题 转化 成 另 


日 yi > 0. 换 句 话说, 约 


二 


[Lb 


< 


干 更 少 而 已 ). 因此 , 答案 就 是 (545 
月 对 问题 的 最 初 理解, 我 们 也 能 做 出 解释 . 因 


C157) = (0 = 126 


问题 (只 不 过 被 分 配 的 


拿 到 了 


另外 , 利 
饼干 , 而 且 一 共有 5 个 人 , 所 以 我 们 已 经 知道 了 其 
饼干 都 完全 相同 , 所 以 每 个 人 者 
人 


干 需要 分 发 . 于 是 , 得 到 了 与 前 面 一 样 的 结果 (2 ) = 


度 解释 问题 是 很 重要 的 , 因为 不 同 的 解释 有 时 会 带 给 我 


我 们 还 可 以 研究 大 量 有 趣 的 相关 问题 , 但 这 相 


在 这 里 吧 . 在 6.3.3 节 


6 ,我 搜集 了 一 些 相关 问题 , 感 兴趣 的 话 可 以 看 一 下 . 解决 
问题 越 多 , 你 对 这 些 论 述 的 内 化 就 会 越 好 , 将 来 也 能 更 清楚 地 认识 到 


为 每 个 人 都 会 拿 到 1 块 
中 5 块 饼 干 的 分 法 . 又 因为 所 有 
块 饼 干 就 意味 着 现在 只 剩 下 10 一 5==5 块 


门 更 加 深刻 的 见解 . 
做 会 让 我 们 离 题 更 


(9) = 126. 能 从 多 个 角 


远 , 所 以 就 


ey 


如 何 利 用 这 些 


| 


©O 
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方法 解决 新 问题 . 所 以 , 如 果 感 兴趣 并 且 有 充足 的 时 间 , 你 可 以 看 看 这 些 问 题 及 其 
解决 方法 . 接着 往 下 看 6.3.2 节 也 是 个 不 错 的 选择 , 我 们 将 利用 该 方法 来 解决 彩票 


问题 . 


彩票 是 一 个 庞大 的 产业 . 有 多 庞大 ? 每 年 仅 美国 州立 彩票 的 收入 就 轻松 地 超过 
了 500 亿美 元 ! 在 本 节 中 , 我 们 将 专注 于 计算 在 各 种 彩票 中 能 猜 中 所 有 数 的 概率 . 
当然 , 如 果 猜 中 了 部 分 数 , 你 仍然 可 以 赢得 一 笔 钱 , 但 我 们 的 目标 不 是 帮 你 弄 清楚 
该 不 该 玩 . (提醒 : 不 该 玩 ! ) 在 9.2 中 , 当 考 察 期 望 值 时 , 我 们 会 对 这 一 点 展开 讨 


论 . 


我 们 从 一 种 标准 彩票 开始 . 

例 6.3.1 现在 , 彩票 头 奖 的 奖金 是 2500 万 美元 . 这 种 彩票 的 玩法 如 下 : 有 50 
个 球 , 编号 依次 为 1 到 50. 从 中 随机 地 选 出 6 个 球 , 这 意味 着 任何 数 都 不 可 能 被 选 
2 次 . 如 果 恰 好 选 对 了 所 有 数 , 那么 你 就 赢得 了 2500 万 美元 ; 如 果 所 有 号 码 都 没 选 
对 , 那 你 就 输 了 . 你 能 赢得 奖金 的 概率 是 多 少 ? 假设 选 6 个 数 需 要 花费 1 美元 , 而 
且 只 有 当 所 有 数 都 选 对 时 才能 赢得 奖金 . 那么 , 是 否 值得 购买 所 有 可 能 的 选择 ? (不 
管 怎 样 , 假设 你 有 足够 的 钱 来 下 注 ! ) 

解答 : 对 于 这 个 问题 , 首先 要 认识 到 , 每 个 球 都 不 可 能 被 选 2 次 , 因此 所 有 球 
都 是 无 放 回 地 选取 . 另外 , 对 玩家 来 说 , 他 们 只 需要 选 出 正确 的 数 , 所 以 选 球 的 次 序 
无 关 紧要 . 因此 , 从 50 个 球 中 无 序 地 选 出 6 个 球 , 共有 (中) 种 方法 : 

50 50! 50.49.48.47.46.45 

的 二 

对 玩家 来 说 , 要 想 赢得 奖金 , 必须 猜 中 全 部 6 个 数 , 所 以 他 的 猜测 必须 与 精确 的 结 
果 相 符 . 也 就 是 说 , 赢得 奖金 的 概率 正好 是 1/15 890 700. 这 个 概率 不 算 大 . 

但 是 , 如 果 一 个 玩家 花 了 15 890 700 美元 来 购买 彩票 , 那么 从 理论 上 说 他 可 以 
买 到 所 有 可 能 的 结果 , 这 样 就 能 保证 赢得 头 奖 ; 又 因为 赢得 的 奖金 是 2500 万 美元 ， 
所 以 这 肯定 是 值得 一 赌 的 . 

彩票 发 行 机 构 刚 刚 听 说 , 头 奖 的 奖金 太 高 , 导致 可 能 有 一 批 富 人 把 所 有 彩票 都 
买 光 . 不 难看 出 , 有 些 富 人 会 这 么 做 , 因为 这 完全 没有 风险 , 而 且 还 有 接近 1000 万 
美元 的 利润 (或 者 说 , 接近 1 倍 投资 的 利润 ). 当然 , 购买 所 有 可 能 的 彩票 会 存在 困 
难 旦 要 付出 一 定 的 代价 , 但 人 们 很 聪明 , 通常 能 找到 解决 这 些 问题 的 办 法 . 因此 , 彩 
票 发 行 机 构 很 担心 , 他 们 决定 做 出 一 些 改变 . 

例 6.3.2 ”现在 彩票 改变 了 规则 : 每 次 选取 都 等 可 能 地 取 到 1 到 50 中 的 任意 
一 个 数 ; 因此 , 这 6 个 中 奖 数 中 可 能 会 有 重复 . 那么 , 这 6 个 数 有 多 少 种 选 法 ? 赢 
得 头 奖 的 概率 有 多 大 ? 如 果 玩 一 次 仍 要 花费 1 美元 , 是 否 值得 对 所 有 可 能 的 组 合 下 
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注 ? 

一 旦 彩票 改变 了 规则 并 允许 数 重 复出 现 , 我 们 束 必 须 重 新 考虑 应 对 和 集 略 了 . 和 
之 前 的 情形 一 样 , 次 序 并 不 重要 , 但 现在 数 可 以 重复 出 现 . 通过 一 个 方程 , 我 们 可 以 
知道 现在 有 多 少 种 不 同 的 结果 , 但 乍 一 看 它 会 令 人 感到 困惑 . 为 了 弄 清楚 问题 的 难 
度 及 微妙 程度 , 我 们 先 给 出 一 个 貌似 合理 的 方法 , 但 它 会 导致 一 个 错误 的 答案 . 然 
后 , 我 们 将 分 析 失 败 的 原因 , 并 通过 正确 的 分 析 得 出 结论 . 我 知道 , 讨论 错误 的 答案 
会 让 人 感到 困惑 , 但 我 强烈 建议 你 这 样 做 . 有 必要 看 一 看 人 们 都 会 犯 哪些 错误 , 这 
样 你 就 能 意识 到 这 些 倾 向 并 提高 警惕 . 
错误 分 析 I: 每 个 数 都 有 50 种 选择 , 所 以 一 共有 505 种 可 能 的 结果 . 但 是 , 这 
种 做 法 添加 了 次 序 . 我 们 一 共有 6 个 数 , 所 以 这 里 应 该 再 除 以 61, 那么 可 能 中 奖 的 
彩票 个 数 为 


505 
Gr 21 701 388.888 88.... 


分 析 : 很 容易 看 出 , 这 不 可 能 是 正确 的 , 因为 最 后 得 到 的 不 是 一 个 整数 ! 哪里 
出 错 了 ? 出 错 的 地 方 是 “ 除 以 61”. 如 果 所 有 数 均 不 相同 , 那么 没 错 , 我 们 多 乘 了 一 
个 因子 6!. 但 是 , 如 果 有 2 对 重复 的 数 , 情况 又 如 何 ? 此 时 我 们 多 乘 了 一 个 2!2!. 如 
果 有 一 个 重复 出 现 3 次 的 数 和 一 个 重复 出 现 2 次 的 数 , 那么 多 乘 的 因子 就 是 312!. 
很 遗憾 , 简单 地 把 结果 除 以 6! 是 无 法 删除 次 序 的 . 

错误 分 析 IT: 因为 数 可 以 重复 , 所 以 可 能 的 结果 会 更 多 . 由 于 1 个 数 可 以 被 选 
择 多 达 6 次 , 因此 不 妨 设 每 个 数 都 有 6 个 副本 可 供 选 择 . 又 因为 有 50 个 不 同 的 数 ， 
所 以 现在 一 共有 300 个 球 可 供 选择 , 我 们 只 需要 从 中 选 出 6 个 . 现在 仍然 不 需要 考 
虑 次 序 , 所 以 再 次 利用 组 合 来 计算 一 共有 多 少 种 结果 : 


300 300! 
Be 61097 962 822 846 700 


分 析 : 稍 后 我 们 会 看 到 正确 答案 是 28 989 675. 这 比 没有 重复 数 的 彩票 总 数 
15 890 700 多 了 一 点 , 却 远 远 小 于 上 面 给 出 的 答案 962 822 846 700. 为 什么 上 述 答 
案 会 有 这 么 大 的 偏差 ? 原因 就 是 对 1 个 数 创建 了 6 个 副本 . 由 于 我 们 假设 现在 一 
共有 300 个 不 同 的 数 , 所 以 这 些 副 本 被 看 作 是 互 不 相同 的 . 你 可 以 考虑 一 个 具体 的 
数 , 比如 6 种 不 同 颜色 的 17 (红色 的 17、 蓝 色 的 17、 黑 色 的 17 .……… ), 或 者 拥有 
6 种 不 同 下 标的 17 (171,172,… ,176). 问题 是 , 我 们 并 不 关心 拿 到 的 是 哪个 17, 只 
在 乎 得 到 了 多 少 个 17. 因此 , 这 种 方法 添加 了 一 些 不 需要 的 结构 , 这 就 是 结果 如 此 
多 的 原因 . 我 们 不 想 对 不 同 的 17 进行 区 分 , 只 关注 选 出 了 多 少 个 17. 

第 一 种 解法 : 一 种 不 算 太 差 的 方法 是 把 它 写成 


00 507 20: 20. 90. 0 
DD 


i1=1 i2=il i3=i2 i4=is i5=i4 i6=is 


218 第 6 章 计数 III 高 等 组 合 学 


为 什么 这 就 是 答案 ? 任意 给 定 1 组 彩票 中 奖 号 码 , 把 这 组 数 按照 从 小 到 大 的 次 序 重 
新 排列 , 并 写 下 新 序列 . 按照 递增 次 序 , 不 妨 设 该 序列 是 (ij,i2,… ,i6). 注意 , 2 可 
以 是 1 和 50 之 间 的 任意 1 个 数 . 那么 is 呢 ? 它 起 码 和 站 一 样 大 , 且 不 会 超过 50. 
类 似 地 , js € {io,… ,50}, 依 此 类 推 . 把 上 述 和 计算 出 来 , 我 们 就 得 到 了 28 989 675. 

虽然 这 个 结果 看 起 来 好 像 并 不 明朗 , 但 有 一 些 方法 可 以 算出 这 样 的 和 . 如 果 考 
虑 更 一 般 的 情况 , 即 从 NN 个 不 同 的 数 中 选 出 6 个 (不 考虑 次 序 , 但 允许 数 重复 出 
现 ), 那么 


人 N6 +15N5 4 85N4 + 225N3 4+ 274N? + 120N 
> > 2 > > 1= 720 . 


i1=1 i2=i1 i3=i2 i4=is is=i4 i6=is 

第 二 种 解法 : 绕 过 这 些 求 和 , 直接 写 出 答案 ! 关键 的 思路 是 采用 我 们 在 6.3.1 节 
研究 饼干 问题 时 所 学 到 的 观点 . 我 们 把 这 个 分 析 过 程 修改 一 下 , 并 将 其 应 用 到 彩票 
问题 上 . 饼干 问题 的 关键 想法 是 什么 ? 正 是 划分 与 有 效 分 组 之 间 的 一 一 对 应 关系 . 

我 们 考虑 更 一 般 的 情况 , 即 有 NN 个 球 , 而 不 是 50 个 球 . 所 以 , 现在 有 NN 个 数 
(每 个 球 上 有 1 个 数 ), 我 们 要 从 中 选 出 个 球 , 且 允 许 重复 选择 同 1 个 球 . 重要 的 
是 每 个 数 被 选 了 多 少 次 , 而 不 是 选择 的 次 序 . 假设 有 NN 十 一 1 个 球 排 成 一 列 , 我 们 
要 从 中 选 出 天 个 . 那么 一 共有 (> 种 选 法 . 令 NN = 50 且 =6, 我 们 得 到 

50+6—1 551 
( ) = sla = 28 989 675, 

这 正 是 上 面 6 个 连 加 和 的 结果 ! 

现在 , 我 们 还 弄 不 清楚 为 什么 这 样 可 行 ; 但 是 , 在 继续 往 下 读 之 前 , 花 几 分 钟 去 
思考 一 下 . 给 你 一 个 提示 , 划分 是 比较 重要 的 看 看 你 能 否 找到 相关 论述 . 这 是 
一 个 非常 难 的 问题 , 是 我 知道 的 较 难 的 概率 问题 之 一 . 

好 了 , 为 什么 会 这 样 呢 ? 为 了 便于 讨论 , 在 接 下 来 的 问题 中 , 我 们 会 让 N = 50 
且 = 6, 但 整个 论证 过 程 仍 适用 于 一 般 情 况 . 我 们 已 经 从 55 个 写 有 数 的 球 中 选 出 
了 6 个. 不 妨 设 被 选中 的 球 分 别 是 1< 广 < jp <js<ja<js<je<55. 我 们 要 把 
这 些 数 转换 成 6 位 数 的 彩票 号 码 . 通过 给 出 6 个 具体 的 球 , 我 们 对 结果 做 出 解释 . 

假设 我 们 选择 了 以 下 6 个 球 : 1、5、8、9、22 和 30. 现在 把 这 些 球 拿 走 . 于 是 ， 
在 这 列 球 中 就 有 了 6 个 空位 , 这 些 空位 分 别 对 应 着 彩票 上 的 6 个 数 , 确定 这 些 数 的 
方法 如 下 : 简单 地 数 一 下 , 从 起 点 开始 一 直到 空位 , 剩 下 的 球 一 共有 多 少 个 ; 然后 
再 把 球 的 个 数 加 1, 这 就 是 该 空位 所 对 应 的 彩票 上 的 数 . 
例如 , 第 1 个 被 选中 的 数 是 1, 所 以 第 1 个 球 会 被 拿 走 ， 从 左 端 开始 , 起 始 位 
置 与 第 1 个 空位 之 间 没 有 球 一 一 第 1 个 空位 出 现在 第 1 个 位 置 . 加 上 1 之 后 , 有 
十 1 二 1, 所 以 我 们 得 到 的 第 1 个 彩票 号 码 是 1. 下 一 个 空位 是 第 5 个 球 所 在 的 位 
置 因为 第 1 个 球 也 被 拿 走 了 , 所 以 在 起 始 位 置 与 第 2 个 空位 之 间 , 只 剩 下 ] 


| 


be 
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3 个 球 (也 就 是 第 2、 第 


3 和 第 4 个 球 ). 


因此 , 第 2 


个 彩票 号 码 是 3 十 1 = 4. 


接 下 来 被 选中 的 是 第 8 个 球 . 在 它 前 面 , 没 被 选中 的 球 一 共有 5 个 (第 2、 第 


3、 第 4、 第 6 和 第 7 个 球 ) 


, 所 以 它 对 应 的 彩票 号 码 是 6 ( 即 5 1). 因为 下 个 被 


选中 的 是 第 9 个 球 , 而 它 紧 跟 在 第 8 个 球 之 后 , 所 以 在 它 前 面 未 被 选中 的 球 也 是 5 
个 ; 因此 它 对 应 的 彩票 号 码 也 是 6. 继续 进行 下 去 , 我 们 看 到 在 第 22 个 球 之 前 还 剩 


下 17 个 球 , 所 以 第 5 个 彩票 号 码 是 18 ( 即 17 十 1). 最 
剩 下 24 个 球 , 因此 最 后 1 个 彩票 号 码 就 是 25 ( 即 24 十 1). 


就 是 1、4、6、6、18 和 25. 


那么 ， 


后 , 由 于 在 第 30 个 球 之 前 还 


彩票 上 的 6 个 数 


在 这 个 过 程 中 , 我 们 从 最 初 的 55 个 球 中 选 出 了 6 个 球 , 而 其 中 每 个 球 都 产生 


了 1 个 彩票 号 码 . 


彩票 号 码 可 以 有 6 个 相同 的 数 , 而 这 个 结果 可 以 通过 在 1 列 中 


选 出 6 个 球 来 得 到 ,因为 一 共 要 拿 走 6 个 球 , 所 以 我 们 永远 不 会 得 到 大 于 50 ( 即 


55 一 6 十 1) 的 结果 . 对 于 这 6 个 被 拿 走 的 球 , 每 选 


(按照 从 小 到 大 的 顺序 排列 ). 
6 个 的 方法 数 就 等 于 彩票 数 . 


正如 上 面 所 讨论 的 , 我 们 的 在 


法 有 多 少 种 :() = 28 989 675. 


因此 , 如 果 现 在 仍 要 花 1 美元 来 购买 头 奖 奖金 为 2500 万 美元 的 彩票 ， 


注 于 所 有 可 能 的 结果 就 不 


有利 可 图 
和 往常 一 样 , 我 们 来 看 一 些 极端 情形 的 例子 , 以 便 更 好 地 到 
果 拿 走 了 前 6 个 球 , 我 们 就 得 到 了 1、1、1、1、1 和 1. 


了 . 彩票 发 行 机 构 


相反 , 女 


上 1 个 球 就 对 应 着 1 个 彩票 号 码 
因此 , 如 果 可 以 重复 取 球 的 话 , 我 们 从 55 个 球 中 选 出 


知道 选 出 这 6 个 球 的 方 


E 解 


那么 


改 得 很 不 错 ! 


E 面 的 论述 . 如 


1 果 拿 走 的 是 最 后 


6 个 球 (50、51、52、53、54 和 55), 那么 彩票 号 码 就 只 能 是 50、50、50、50、50 和 
50. 很 重要 的 一 点 是 , 要 确保 选取 的 彩票 号 码 绝 不 会 大 于 50. 现在 来 证 明 我 们 不 可 


能 得 到 51, 其 他 的 数 可 以 按照 同样 的 方法 证 明 . 如 果 想 得 到 51, 昼 


52、53、54 或 55. 开始 拿 走 


像 51 这 样 的 大 数 , 最 好 的 办 法 就 是 拿 走 52、53、54 和 55; 如 果 


的 球 越 多 , 得 到 的 数 就 会 越 4 


就 得 不 到 这 样 的 数 . 记 住 , 我 们 需要 选 出 6 个 球 , 但 现在 只 


51 之 前 , 我 们 至 少 要 选择 2 


个 球 (51 可 以 包含 在 


不 会 超过 50 (可 能 的 最 大 数 是 51 -2 十 1 = 50). 


对 这 个 问题 做 最 后 一 点 说 明 . 如 果 可 以 编写 


- 


因此 ， 


5 么 我 们 必须 选择 
如 果 想 得 到 一 个 


考虑 了 4 个 球 . 所 以 , 在 


改 不 到 这 一 点 , 那 


中 ), 这 样 才能 


些 计算 机 代码 3 


保 彩 票 上 的 数 


得 到 才干 结果 ， 


那 你 就 有 机 会 发 现 其 中 的 规律 . 不 要 回避 实验 数学 一 一 数据 很 棒 ! 用 了 不 到 10 秒 ， 
Mathematica 就 在 计算 机 上 求 出 了 总 和 . 如 果 输 入 


Sum[Sum[Sum[Sum[Sum[Sum[1, {i6, i5, 50}], {i5, i4, 50}], 
{i4, i3, 50}], {i3,i2, 50}], {i2, i1, 50}], {i1, 1, 50}] 


或 采用 更 好 的 方式 , 输入 


Sum[1, {i1,1,50}, {i2,i1,50}, {i3,i2,50}, {i4,i3,50}, 


{i5,i4,50}, {i6,i5,50}] 


A 
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那么 过 一 会 儿 就 能 得 到 28 989 675. 当然 , 我 们 还 可 以 考虑 49 个 数 、48 个 数 或 者 
51 个 数 , 并 收集 更 多 的 数据 . 如 果 你 认为 答案 看 起 来 像 是 一 个 二 项 式 系数 , 那么 可 
以 考察 形 如 Ce) 的 表达 式 , 其 中 也 数 f 和 g 是 关于 N 和 大 的 函数 , 而 N 表示 
球 的 总 数 , 上 表示 我 们 要 选 出 的 球 的 个 数 ， 如 果 多 看 看 各 种 二 项 式 系 数 , 那么 一 段 
时 间 后 , 我 们 有 可 能 见 到 ( 轨 ) = 28 989 675. 如 果 不 仅 考察 N = 50 的 情况 , 还 考察 
了 WN 取 其 他 值 的 情况 , 那么 就 能 得 到 更 多 数据 , 也 有 可 能 猜 到 FLN, 包 =N+R-1 
是 g(N,k) = k. 让 天 固定 并 改变 N, 然后 固定 NN 并 变动 , 这 将 有 助 于 我 们 了 解 
函数 的 真实 性 状 . 

如 果 了 解数 学 归纳 法 (不 了 解 的 话 , 请 参阅 A.2 节 中 的 讨论 ), 你 就 会 明白 , 当知 
道 答案 是 什么 时 , 利用 数学 归纳 法 来 证 明 会 容易 很 多 . 举 个 例子 , 用 归纳 法 证 明 前 
NN 个 整数 的 和 是 N(N 十 1)/2, 或 者 证 明 前 个 平方 数 之 和 是 N(N +1)(2N +1)/6 
并 不 可 怕 . 立方 和 以 及 上 次 容 之 和 也 都 有 类 似 的 公式 . 如 果 你 不 知道 这 个 公式 , 那 
么 归纳 起 来 就 更 难 了 ! 想 了 解 更 多 内 容 , 请 参阅 习题 6.5.11. 

那么 , 要 点 是 什么 呢 ? 考察 较 小 的 问题 , 建立 一 个 直观 的 认识 , 并 找 出 其 中 的 规 
律 . 不 考虑 从 50 个 球 中 选 出 6 个 , 而 是 考察 从 8 个 球 中 选取 3 个 的 情况 . 通过 考 
察 这 些 较 简单 情况 , 你 可 以 了 解 发 生 了 什么 , 用 以 指导 解决 一 般 问题 . 


6.3.3 ”其 他 划分 


虽然 下 面 的 问题 与 我 们 在 本 书 中 讨论 的 概率 问题 没有 直接 联系 , 但 它们 都 是 对 
饼干 问题 的 自然 推广 . 我 之 所 以 喜欢 这 些 问 题 , 是 因为 当 从 正确 的 角度 考察 这 些 问 
题 时 , 它们 都 有 不 错 的 解决 方案 . 由 于 本 书 的 主要 目的 是 帮助 你 提高 解决 问题 的 能 
力 , 我 会 在 这 里 介绍 更 多 有 趣 的 问题 及 其 解决 方案 . 

在 求解 整数 方程 时 , 系数 的 细微 变化 往往 会 导致 截然 不 同 的 方程 属性 和 不 同 
的 解 集 . 确定 下 列 方程 的 非 负 整数 解 的 个 数 : (1) zi + za = 1996; (2) 2z1 十 2x2 = 
1996; (3) 2x1+2x2 = 1997; (4) 2z1 十 3za = 1996; (5) 2z1 十 2z? 十 2z3 十 2z4 = 1996; 
(6) 2x1 + 2za + 3x3 十 3z4 = 1996. 

解答 : (1) 有 1997 个 解 . 这 是 因为 zi 可 以 取 {0,1,… ,1996} 中 的 任意 一 个 值 ; 
当 zl 被 选 定 后 , za 也 就 被 唯一 确定 下 来 . 这 相当 于 把 1996 块 饼干 分 发 给 2 个 人 
的 饼干 问题 , 即 有 (19%1+2-1) = (1997) = 1997 种 分 法 . (2) 让 等 式 两 端 同时 除 以 2， 
这 个 方程 就 等 价 于 zi + za = 998. 与 (1) 的 论述 过 程 一 样 , 这 个 方程 有 999 个 解 . 
(3) 这 个 方程 没有 解 , 因为 等 式 左 端 始终 是 偶数 , 但 右 端 始终 是 奇数 . (4) 显然 , 一 旦 
选 定 了 zi 或 zz, 那么 男 一 个 未 知 量 最 多 只 有 1 个 可 能 的 取 值 . 我 们 先 确定 za 的 
值 . 因为 zi = (1996 - 3x2)/2, 所 以 1996 - 3za 一定 是 个 偶数 . 因此 , zs 也 必须 是 
个 偶数 . 这 意味 着 za 可 以 是 0,2,4,.…, (因为 666 .3 = 1998). 对 于 zo 的 333 个 
取 值 , 其 中 每 一 个 都 恰好 对 应 着 zi 的 一 个 值 . 因此 , 该 方程 有 333 个 解 . (5) 与 (2) 


心 


et 
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类 似 . 如 果 让 等 式 两 端 同 时 除 以 2, 那么 方程 就 变 成 了 zi + za 十 xz3 十 x4 二 998. 这 
正 是 把 998 块 饼干 分 发 给 4 个 人 的 饼干 问题 , 因此 答案 就 是 (83 0) = (21%), 即 
166 666 500. 注意 , 这 个 方程 的 解 比 其 他 方程 多 很 多 . 原因 是 这 里 有 4 个 变量 , 但 
之 前 只 有 2 个 变量 . 对 于 2 个 变量 的 情况 , 一 旦 指定 其 中 一 个 的 值 , 那么 另 一 个 上 
值 也 就 随 之 确定 下 来 ; 但 当 有 4 个 变量 时 , 我 们 的 选择 就 自由 多 了 . 
在 这 些 问题 中 , 我 最 喜欢 的 是 (6). 这 是 关于 分 组 的 另 一 个 例子 ; 在 6.2.2 节 中 ， 
我 们 有 效 地 利用 它 来 理解 多 项 系数 ( 另 一 个 例子 请 参见 A.3 节 ). 我 们 可 以 把 方程 
2z1 十 2z? 十 3z3 十 3z4 = 1996 改写 成 2(zi + zz) 十 3(zs + z4) = 1996. 现在 的 问题 看 
起 来 和 (4) 非常 相似 . 令 y= zi 十 x2, y2 = 723 十 XZ4. 当 wp 为 奇数 时 , 方程 无 解 ; 原 
因 在 于 2 = 1996 - 3y2 是 不 可 能 成 立 的 , 因为 等 号 左 端 是 偶数 , 但 右 端 是 奇数 . 然 
而 , 如 果 ys 是 个 偶数 , 那么 yi 就 只 有 唯一 的 选择 , 即 (1996 - 3y2)/2. 接 下 来 , 只 需 
要 求解 za 十 x4 = Yo, V1 二 X11 十 x2 二 (1996 一 3y2)/2 即 可 , 其 中 vy > 0,yo 宕 0 日 为 
偶数 . 我 们 得 到 了 两 个 独立 的 饼干 问题 . zs + zi = yo 有 (33!) = (1!) =yo+1 
个 解 . 同样 地 , 第 二 个 问题 有 (3099632%)+2-1) = (1996 一 3y2) 十 1 = 999 一 3yo 个 
解 . 于 是 , (6) 一 共有 


Eay 


[1996/3] 3 [1996/6] 
> (y+1) (oo 一 3 = >》 (2y+1)(999—3y) = 37092 537 
y2=0 =0 

凡是 偶数 


个 解 , 其 中 |n| 是 地 板 函 数 , 它 表示 小 于 或 等 于 n 的 最 大 整数 . 

有 必要 仔细 地 研究 一 下 (6) 的 解决 方案 . 我 们 都 做 了 哪些 事情 ? 我 们 把 一 个 较 
的 问题 转化 成 了 两 个 较 简 单 的 问题 . 通常 情况 下 , 这 种 转化 是 好 的 : 我 宁愿 做 大 
时 的 简单 计算 然后 把 它们 的 结果 组 合 起 来 , 也 不 希望 去 研究 一 个 难题 . 

下 一 个 问题 与 组 合 有 关 , 它 可 以 用 来 解决 各 种 计数 问题 . 

设 M 是 包含 m > 0 个 元 素 的 集合 , W 是 包含 w > 0 个 元 素 的 集合 , 而 好 是 
包含 m 十 ww 个 元 素 的 集合 . 对 于 Le {0,… ,m 十 ww}, 证 明 


> 

k=max(0,l—w) A ! | 
解答 : 只 要 从 正确 地 角度 考察 问题 , 证 明 其 实 很 简单 . 我 们 会 采用 “故事 证 明 
法 ”, 并 通过 两 种 不 同 的 方式 来 计数 . 不 妨 把 M 看 作 由 m 个 男人 组 成 的 集合 , 把 
W 看 作 由 w 个 女人 组 成 的 集合 , 并 把 PP 看 作 由 m 十 w 个 人 组 成 的 集合 (其 中 有 
m 个 男人 和 ww 个 女人 ). 从 好 中选 出 1 个 人 组 成 一 个 集合 , 共有 多 少 种 方法 ? 只 要 
0 < 1 < m+w, 答案 就 是 二 项 式 系数 ("i*) 的 定义 一 一 从 mw 十 w 个 人 中 选 出 ? 

个 大 ; 


mm 光 
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好 的 , 这 样 就 得 到 了 等 号 


端的 表达 式 , 现在 考虑 


由 7 个 人 组 成 的 集合 , 那么 其 


要 从 m+w 个 人 中 选 出 1 个 人 , 所 以 & 既 不 能 
但 我 们 可 以 得 到 更 好 的 结果 . 如 果 有 <1- w, 就 无 法 选 
因此 一 定 有 大 > 1 一 w. 同样 ， 


人 ， 


人 的 1 组 人 


此 对 全 体 有 效 的 大 求 和 ( 即 左 端 


("7") 种 选 法 
这 个 
棒 的 、 优 美的 解 , 但 困难 在 于 和 


个 有 (,) 种 方法 . 


左 端的 式 子 . 如 果 存 在 一 个 
中 必定 有 些 人 是 男人 . 设 其 中 有 天 个 男人 . 
小 , 也 不 能 太 大 . 显然 有 0 科大 入 m， 
恰好 包含 大 个 男人 的 7 个 
因为 一 共 要 选 出 1 个人, 所 以 不 可 能 有 天 > 1. 于 
是 , max(0,1 一 ww) < 有 < min(m,1). 对 于 这 样 的 k, 从 m 个 男人 中 选 出 天 个 有 (7 
种 方法 , 并 且 从 w 个 女人 中 选 出 / 
£ 有 (加 (2 ) 种 选 法 ， 由 于 每 种 选 法 都 必须 包含 一 定数 量 的 男性 , 因 
的 式 子 ) 就 一 定 考虑 到 了 所 有 可 能 的 选 法 , 也 就 是 


因为 我 们 


因此 , 恰好 包含 大 个 男 


问题 说 明了 一 个 一 般 现象 . 对 于 二 项 式 系数 的 乘积 之 和 , 通常 会 有 一 个 很 
1 何 解释 . 要 想 真正 地 理解 考察 问题 的 正确 角度 所 带 


来 的 巨大 优势 , 你 可 以 试 着 利 
做 代数 运算 一 一 祝 你 好 运 ! 


用 二 项 式 系数 的 定义 直接 求解 问题 , 把 式 子 展开 后 再 


最 后 , 我 们 再 来 看 


还 剩 下 一 些 人 


情 就 会 越 容易 . 
给 已 个 人 有 (ci 
接 使 用 这 个 结果 ; 但 在 做 + 
这 类 似 于 懒惰 原则 的 其 他 


I 


干 , 那么 情况 是 怎 
去 , 在 天 个 人 之 间 分 配 NN 块 饼干 有 多 少 种 方法 
看 到 另 一 个 关于 二 项 式 系数 和 的 恒等式 . 

解答 : 解决 问题 最 困难 的 步 又 之 一 就 是 确定 采 月 
一 个 很 好 的 方向 是 回顾 那些 有 
种 方法 . 因为 现在 有 些 
些 变动 后 , 我 们 就 能 利用 它 了 . 
一 些 例子 . 我 们 # 


后 再 把 它们 结合 起 来 . 假设 一 


分 发 了 n 块 % 


a 


共有 ("# 好 9) 种 分 配方 法 (有 nn 抉 
下 的 方法 数 为 0 全 


一 个 整数 , 因此 分 发 % 


干 和 个 人 ). 


虽然 现 在 解决 了 问题 , 但 这 并 不 是 个 特别 具有 局 
系数 之 和 等 于 什么 呢 ? 很 笠 运 , 当 从 了 


考察 一 个 新 的 人 
解决 这 个 问题 ! 


分 配方 法 一 共 


1 
于 是 , 我 们 不 仅 给 出 了 这 个 问题 的 一 个 优美 的 解 , 而 


Cre J) =) 种 


把 剩 下 的 饼干 都 分 给 这 个 人 . 现在 , 我 们 正在 


个 问题 . 原来 的 饼干 问题 假设 所 有 饼干 都 被 分 完了 . 假如 
样 的 ? 具体 地 说 , 现在 不 需 
7 在 解决 这 个 问题 的 过 程 中 , 我 们 会 


要 把 所 有 分 


干 都 分 发 出 


日 什么 样 的 方法 . 经 验 越 多 , 事 
坚 的 类 似 问题 . 把 C 块 饼干 全 部 分 
干 可 能 没 被 分 发 出 去 , 所 以 不 能 


巴 问题 简化 成 一 堆 更 简单 的 问题 , 然 
干 , 还 镜 下 N 一 n 块 % 
由 于 n 可 以 取 0 到 NN 的 任意 


干 . 此 时 , 一 


发 性 的 解决 方案 . 这 个 二 项 式 
E 确 的 角度 考察 这 个 问题 时 , 我 们 能 立即 写 出 
这 个 和 等 于 什么 . 我 们 正 试 着 计算 把 N 块 相同 的 饼干 分 发 给 大 个 不 同 的 学 生 一 共 
有 多 少 种 方法 , 其 中 有 些 饼 干 可 能 没 被 分 发 出 去 . 想象 一 下 , 假设 还 有 一 个 人 , 他 可 
能 是 某 个 特别 的 学 生 , 也 可 能 是 本 书 的 作者 . 把 那些 没有 分 给 天 个 学 生 的 饼干 都 分 
给 这 个 幸运 的 人 吧 ! 我 们 所 做 的 就 是 
干 问 题 . 要 把 N 块 % 


干 全 部 分 发 给 十 1 个 人 ! 我 们 很 清楚 该 如 何 


得 到 了 二 项 式 系数 之 和 


NM /n+k—l N+ik 
> k—1 ) ( k ) 
6.4 总 结 
《 捉 鬼 敢死队 》 的 下 列 场景 很 好 地 总 结 了 我 们 在 本 章 所 遇 到 的 问题 . 这 是 电影 
的 结尾 部 分 , 四 名 捉 鬼 队员 正 试图 阻止 戈 萨 毁灭 纽约 . 戈 萨 让 他 们 做 出 选择 . 


雷 伊 ”斯 坦 博士 : 你 说 的 选择 是 什么 意思 ? 我 们 不 明白 . 


呈 萨 : 选择 . 选择 毁灭 者 的 形式 . 


本 章 讲 的 是 选择 . 你 要 选择 解决 问题 的 方法 . 刚 开始 
决 的 没什么 关系 . 选择 一 种 解 题 方法 , 祈祷 选 出 的 是 最 好 下 


如 果 无 法 解决 问题 , 那 就 重新 来 过 . 


山 


时 , 不 明白 事情 是 如 何 解 
的 方法 , 并 继续 研究 下 去 ; 


在 这 里 , 我 们 看 到 了 一 些 绕 过 见长 乏味 计算 的 好 方法 ， 这 类 问 
已 其 是 , 我 们 看 到 了 划 
简单 的 选择 问题 (从 一 个 与 最 初 问题 有 关 的 较 大 
h). 另外 , 我 们 还 


你 就 越 容易 找到 优美 的 计算 方法 . 

个 痛苦 的 计数 问题 转化 成 一 个 
集合 中 选 出 若干 元 素 的 方法 有 多 少 利 
使 问题 得 到 了 进一步 简化 . 


6.5 习 


题 


习题 6.5.1 


连续 播放 同一 张 CD 上 的 两 首 歌 | 
情况 如 何 ? 

习题 6.5.2 ”继续 上 面 这 个 关于 
次 选 歌 时 , 每 一 引 

习题 6.5.3 ”在 7 场 系列 赛 中 ， 
系列 比赛 中 , 如 果 没 有 哪 支 球 队 连 

习题 6.5.4 在 7 场 系列 赛 

用 

于 最 有 可 能 发 生 的 情况 , 你 是 否 感到 惊讶 ? 


KE CD 都 等 可 能 地 被 选中 


品 


续 启 


得 2 场 比 赛 , 那 


F CD 的 练习 . 如 果 我 们 播放 了 6 张 CD 中 的 10 首 歌 , 而 
Fr, 那么 至 少 连续 昕 到 同一 引 


有 两 支 球 队 进 行 比赛 , 首先 赢得 4 场 比赛 的 队伍 获 朋 


P (参见 上 一 题 ), 假设 每 个 队 在 每 场 比赛 
E. 那么 , 在 进行 了 4 场 、5 场 、6 场 和 7 场 比赛 后 , 恰好 分 出 胜 负 的 概率 分 别 是 多 少 ? 对 


研究 得 越 多 ， 
| ; 通常 ， 可 以 把 


题 


分 的 作 / 


pan 


看 到 了 了 已 


E 组 表达 式 的 优点 ， 


在 6.1.1 节 考察 了 关于 随机 播放 机 和 6 张 CD 的 几 个 问题. 我 们 看 到 , 当 6 张 
CD 都 被 放 入 时 , 如 果 播 放 了 10 首 歌曲 , 那么 播放 机 选择 CD 的 方法 数 几 乎 是 “不 允许 
由 时 的 6 倍 . 如 果 播 放 了 1 首 歌 ， 那么 当 nN co 时 ， 


每 
两 首 歌 的 要 


| 


K CD 


FE. 在 这 一 
竹 方 式 有 多 少 种 ? 
P 都 有 50% 的 概率 获 


么 不 同 的 获 


A 


成品 


习题 6.5.5 。” 设 nn 是 一 个 正 整 数 , 现在 考察 n 副 特 殊 的 牌 ， 
d 的 牌 组 成 的 ; 我 们 从 1 到 n 中 随机 选 
中 随机 选 出 一 个 数 , 记 作 m2. 然后 再 从 第 mz 副 牌 了 


继续 下 去 , 会 发 生 什么 ? 描述 地 尽 可 能 详细 


口 


一 个 数 , 记 作 m1. 接 下 来 , 我 们 从 


(在 某 段 时 间 内 一 定 会 发 4 


FP 第 d 副 牌 是 


第 mz 副 牌 
随机 选 出 一 个 数 ma. 把 这 个 过 程 
什么， 以 及 在 某 段 
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时 间 内 可 能 会 发 生 什 么 ). 编写 一 个 计算 机 程序 , 对 n 的 各 种 取 值 进行 数值 模拟 , 进而 帮 
你 做 出 一 些 推 测 . 
习题 6.5.6 ”把 上 一 个 练习 推广 到 2n 十 1 的 情形 . 对 于 Ke {十 1,n 十 2,… ,2n 十 1}, 上 述 
游戏 恰好 在 第 次 选取 后 结束 的 概率 是 多 少 ? 对 于 最 有 可 能 的 , 你 是 否 感到 惊讶 ? 
习题 6.5.7 ”考虑 6.1.3 节 的 饶 子 问题 . 如 果 把 所 有 饶 子 都 扔 进 一 个 巨大 的 桶 里 , 那么 现在 有 
400 颗 玻璃 球 , 其 中 190 颗 是 紫色 的 ， 而 剩 下 的 210 颗 是 金色 的 .从 中 取出 5 颗 玻璃 
球 , 那么 至 少 取 出 了 4 颗 紫 色 玻 璃 球 的 概率 是 多 少 ? 与 先 从 4 个 铅 子 中 选 出 1 个 镀 子 
时 的 结果 相 比 , 这 个 答案 如 何 (每 一 个 饶 子 都 等 可 能 地 被 选中 )? 答案 一 样 吗 ? 你 感到 吃 
惊 吗 ? 
习题 6.5.8 ”考虑 一 副 标 准 牌 . 我 们 不 断 地 从 剩 下 的 牌 中 取出 1 张 牌 , 直到 取出 1 张 K 为 止 . 
在 取出 K 之 前 , 至 少 取 到 1 张 Q 的 概率 是 多 少 ? 在 取出 K 之 前 , 我 们 取 到 了 4 张 Q 的 
概率 是 多 少 ? 
习题 6.5.9 MAINE 可 以 构造 出 多 少 个 单词 , 新 单词 的 长 度 可 以 任 取 (但 每 个 字母 最 多 只 
能 使 用 一 次 )? 
习题 6.5.10 ”证 明 6.2.1 节 中 的 “不 同 的 重 排 序 ” 公 式 . 
习题 6.5.11 ” 试 着 写 出 下 列 内 容 的 解析 表达 式 : 
A DD A A A 六 
2 
做 个 猜想 : 你 是 否 相 信 答案 就 是 关于 N 的 多 项 式 , 并 且 多 项 式 的 次 数 就 等 于 连 加 符号 的 
个 数 ? 你 认为 最 高 次 项 的 系数 是 多 少 ? 
习题 6.5.12 ”在 彩票 问题 中 , 我 们 利用 了 


A NS + 15N5 + 85N4 + 225N3 + 274N? + 120N 
2 > > > > > 1= 720 : 


il=1 i2=il i3=i2 i4=i3 让 一 id i6=is 

证 明 该 公式 . (提示 : 这 些 是 斯 特 林 数 .) 

习题 6.5.13 ”与 前 两 个 习题 相同 , 计算 公式 站， ms, 其 中 Re {3,4,5}.， (提示 : 如 果 利 用 
积分 近似 求 和 , 可 以 看 到 这 个 和 约 等 于 N*+1/(k 十 1). 事实 上 , 我 们 还 可 以 更 进一步 : 这 
些 和 是 关于 N 的 天 十 1 次 多 项 式 , 并 且 最 高 次 项 的 系数 为 1/(k 十 1).) 

习题 6.5.14 ”把 15 个 人 分 成 5 个 不 同 的 组 上 且 每 组 有 3 个 人 的 分 配方 法 有 多 少 种 ? 如 果 各 组 
是 不 加 区 分 的 , 情况 又 如 何 ? 

习题 6.5.15 ”一 般 情况 下 , 把 x 个 人 分 成 n 组 , 并 且 每 组 分 别 有 zi, za ,xn 个 人 的 分 配 
方法 有 多 少 种 , 其 中 zi 十 zz 十 :十 Zr 二? 

习题 6.5.16 ”考虑 (。 ,zs,)， 其 中 zi 十 x2 十 … 十 zn 二 Z， 对 于 给 定 的 n, 使 得 


(。 。” ，。) 取 到 最 大 值 的 z1,z2,… ,zn 分 别 是 多 少 ? 不 妨 设 z 可 以 被 n 整除 . 这 
样 做 的 原因 是 , 符号 会 更 加 简单 , 而 且 其 论述 可 以 推广 到 其 他 情形 . 证 明 你 的 结论 . 

习题 6.5.17 ”假设 我 们 正在 为 5 个 人 分 配 10 块 饼干 . 为 了 使 分 配 更 加 公平 , 每 个 人 的 饼干 
都 不 能 超过 拿 到 最 少 饼干 的 人 的 2 倍 . 这样 的 分 配方 法 有 多 少 种 ? 如 果 把 15 块 饼干 分 
给 5 个 人 , 情况 又 如 何 ? 


习题 6.5.18 


我 们 要 把 15 块 相 


习题 6.5.19 


多 可 以 拿 到 10 弓 


干 , 那么 有 多 少 种 分 配方 法 ? 是 


法 (那么 第 1 个 人 至 少 拿 到 


干 分 发 给 4 个 人 ， 如 果 只 考虑 1 个 人 拿 到 了 几 块 饼 
新 看 这 个 练习 , 现在 考虑 第 i 个 人 至 少 拿 到 i 块 饼干 的 分 
饼干 , 依 此 类 推 


题 (15 块 相同 的 饼干 和 4 个 人 ), 但 现在 有 下 列 限 制 : 每 个 人 最 
攻 有 些 人 可 能 没有 饼干 ). 


习题 6.5.20 “把 一 颗 均 匀 的 人 般 子 投掷 60 次 , 恰好 掷 出 10 个 1 和 410 个 2 的 概率 是 多 少 ? 


习题 6.5.21 


的 错误 : 首先 , 我 


门 计算 抛 括 出 的 数字 组 合 有 多 少 种 : 因为 已 


经 给 定 了 20 个 数字 ( 即 1 和 2), 所 以 考虑 把 40 个 ( 抛 括 ) 结果 分 配给 4 个 对 象 ( 即 数 
字 3,4,5 和 6) 的 方法 有 多 少 种 ? 我 们 不 考虑 分 配 的 先后 次 序 , 只 关心 每 个 数字 出 现 了 多 


少 次 . 
习题 6.5.22 


假设 一 个 仅 在 某 小 镇 播 出 的 电视 节目 有 200 位 观众 , 其 中 笑 
本 


FE 龄 介 于 11 和 20 


岁 之 间 的 观众 有 50 位 . 这 是 否 足以 表明 该 年 龄 段 的 人 是 主要 的 观众 群 ? 已 知 在 这 个 小 


镇 里 , 0 到 10 岁 的 人 
是 150, 31 到 45 岁 站 


是 150. 
习题 6.5.23 


习题 6.5.24 


有 NN 个 物体 , 其 


br 
不 7 示 


想象 一 下 , 一 张 住 


口 数 是 300, 11 到 20 岁 的 人 
口 数 是 150, 46 到 60 岁 的 人 口 


FP K 个 是 成 功 的 ; 在 n 次 无 放 
次 成 功 的 概率 是 多 少 ? (提示 : 遇 到 困难 的 话 , 就 总 结 一 下 上 一 个 练习 .) 
上 写 有 100 个 学 9 


数 是 200, 21 到 30 岁 的 人 口 数 
数 是 150, 超过 61 岁 的 人 口 数 


回 地 抽取 中 , 取 到 


E 想 要 入 住 的 楼 号 . 一 共有 5 幢 楼 


分 别 是 4、B、C、D 和 忆 . A、B 和 CO 号 楼 均 可 入 住 20 个 人 , D 号 楼 可 以 入 住 30 个 


人 , 而 巨 号 楼 可 以 入 住 10 个 人 . 妇 


等 的 , 并 


岂 们 的 选择 相互 独立 , 那么 每 个 学 生 者 


习题 6.5.25 


习题 6.5.26 ”考虑 这 样 的 彩票 . 从 1 
概率 都 是 相等 的 . 只 要 选 上 
等 的 吗 ? 如 果 不 是 ， 
习题 6.5.27 ”考虑 


I 果 每 个 学 生 想 3 


ZN 


更 入 住 


5 童 楼 中 任意 1 幢 的 概率 是 相 


其 最 想 入 住 的 育 


上 50 有 放 回 地 


干 尽 可 能 公司 


Es 


数量 以 及 | 
长 的 时 间 来 分 析 .) 编写 Mathematica 代码 , 使 


你 找到 的 最 公司 


习题 6.5.28 


然后 搜索 
机 不 断 重复 上 述 过 程 , - 


能 入 住 其 首选 那 幢 楼 的 概率 是 多 少 ? 
楼 之 一 的 概率 . 
取出 10 个 整数 , 并 且 每 次 取 到 任何 数 的 


分 进行 比较 . 这 就 是 所 i 


习题 6.5.29 


4 份 . 分 发 这 些 


饼干 的 方法 有 多 少 种 ? 


都 可 能 拿 到 有 到 


配方 法 ? 


了 多 次 划分 ， 而 是 从 一 个 随机 


进 和 
选择 , 直到 找到 最 接近 了 
曾 加 划分 公平 性 的 选择 为 止 . 
的 “ 贪 禁 算 法 ”, 它 可 以 找 至 
F 和 5 个 人 的 饼干 问题 , 但 
现在 , 假设 所 在 
干 , 也 可 能 拿 到 无 理 数 (例如 , /6) 弓 


H 10 个 数 就 行 了 , 不 用 考虑 次 序 . 所 有 彩票 的 中 奖 概率 都 是 相 
选 哪 张 彩票 , 这 张 彩票 中 奖 的 概率 是 多 少 ? 

两 个 人 , 并 且 有 不 可 分 割 的 几 堆 饼干 . 我 们 想 把 这 些 饼 

天 个 人 . 随机 生成 者 干 堆 饼干 . (你 可 以 确定 最 大 的 那 堆 饼干 的 

, 但 不 要 让 数 太 小 , 避免 情况 太平 凡 ; 也 不 要 太 大 , 避免 花费 很 

其 能 够 随机 地 对 饼干 集合 进行 多 次 划分 . 


[的 划分 开始 编写 代码 ， 
近 于 公平 划分 的 选择 为 止 . 让 计算 
巴 这 个 划分 与 上 一 题 的 划 
上 多 种 优化 问题 的 近似 解 . 
岗 在 每 块 饼干 都 可 以 被 分 成 2 份 或 
饼干 都 是 完全 连续 的 , 那么 每 个 人 
饼干 . 这 些 饼 干 有 多 少 种 分 
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习题 6.5.30 ”Amy、Ben 和 Cathy 正在 玩 一 副 包 含 52 张 扑 克 牌 的 标准 牌 . 每 个 人 有 序 地 和 
出 1 张 牌 . 一 旦 有 人 拿 到 1 张 黑 桃 , 游戏 就 结束 了 , 并 且 拿 到 黑 桃 的 这 个 人 获胜 . 在 有 放 
取 和 无 放 回 抽取 的 情况 下 , 每 个 人 获胜 的 概率 分 别 是 多 少 ? (提示 : 回想 一 下 我 们 讨 


论 过 的 篮球 问题 .) 


日 


3 


第 7 章 离 


洛 伦 : 嗨 , 我 是 不 是 见 过 你 ? 
是 


在 前 几 章 中 , 我 们 曾 述 了 概率 公 弄 
如 纸牌 游戏 的 牌 型 和 彩票 . 当然, 这 些 只 是 我 们 想 要 丰 
是 介绍 随机 变量 的 概念 并 讨论 一 些 特例 . 


的 , 没 错 , 我 是 乔治 , 乔治 麦克 党 菜 . 我 是 你 名 


密度 


一 一 《 回 到 未 来 》(1985) 


并 学 习 了 如 何 计算 某 些 离散 事件 的 概率 , 比 


通俗 地 说 , 随机 变量 就 是 从 结果 空 
变量 , 然后 看 看 连续 型 随机 变量 会 有 什么 相 


盒子 里 分 子 的 运行 速度 , 棒球 比赛 中 一 个 球 队 的 得 分 , 想 要 
及 学 生 在 概率 考试 中 的 成 绩 . 希望 你 能 明白 


塑造 真实 世界 的 关键 要 素 . 


7.1 ”离散 型 随机 变量 : 定义 


本 节 给 出 离散 型 随机 变量 的 定义 . 为 了 给 


例子 , 然后 从 这 些 讨论 中 提取 出 定义 . 


想象 一 下 , 我 们 把 一 枚 均匀 的 人 硬 
是 50%, 掷 出 反面 (7T) 的 概率 也 是 50%. 


因此 , 结果 如 


究 的 


小 部 分 . 本 章 的 目的 


间 到 实数 集 的 映射 . 我 们 先 讨论 离散 型 随机 


和 的 变化 . 随机 变量 随处 可 见 , 比如 一 个 
搭乘 城 际 航班 的 人 数 , 以 
这 一 点 . 随机 变量 无 处 不 在 , 是 描述 和 


定义 , 我们 先 来 考虑 一 个 局 发 性 的 


抛掷 了 3 次 . 每 次 搬出 正面 ( 互 ) 的 概率 都 


E 间 9 


PP 有 8 个 可 能 的 结果 : 


Q = {TTT, TTH, THT, HTT,THH, HTH, HHT 和 HHHY. 


我 们 要 为 9 中 的 每 个 元 素 指定 一 个 概率 . 因 
1/2, 并 且 3 次 抛 搓 是 相互 独立 的 , 所 以 Q 


硬币 出 现 正 面 的 概率 都 是 


1/8. 于 是 , 我 们 得 到 了 结果 空间 和 概率 函数 (由 于 结果 空间 是 有 限 的 , 因此 o 代数 


就 是 由 9 的 全 体 子 集 构成 的 集合 ). 


每 个 元 素 的 概率 都 是 1/2 . 1/2 . 1/2 = 


我 们 有 大 量 问 题 要 问 . 最 自然 的 一 个 问题 是 : 能 否 得 到 一 个 抛掷 序列 ? 我 们 已 


经 回答 了 这 个 问题 : 每 个 序列 出 现 的 概率 都 是 1/8. 但 是 , 我 
题 . 一 个 很 棒 的 问题 是 ; 正面 出 现 了 多 少 次 ? 也 许 每 得 到 一 个 
万 美元 . 如 果真 是 这 样 , 我 们 不 会 关心 正面 


出 现 日 


门 还 想 问 一 些 其 他 问 


E 面 , 我 们 就 能 赚 100 
出 现 了 多 少 次 


正面 . 事实 上 , 把 这 8 个 结果 排 成 一 列 囊 


i 是 为 J 


好 地 回答 这 个 问题 . 我 们 看 到 , 没 
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有 出 现 了 


X(w) 等 


E 面 的 结果 有 1 个, 出 现 1 次 正面 的 结果 有 3 个 , 出 现 2 次 正面 的 结果 有 3 
个 , 出 现 3 次 正面 的 结果 有 1 个 . 
这 可 以 用 一 个 函数 来 表示 .我 们 定义 一 个 从 Q 到 实数 集 及 的 函数 X, 其 中 


于 weQ 中 正面 出 现 的 次 数 . 


因此 , X(HHT) = 2, X(TTT) = 0, 等 等 . 


还 可 以 定义 其 他 函数 .我们 可 能 会 对 反面 出 现 的 次 数 感 兴趣 .现在 就 可 以 把 


Y(w) 设 


3 次 , 并 且 每 次 搓 


) 十 Y(w) = 3. 这 并 不 奇怪 , 我 们 一 共 抛 掷 了 


为 反面 出 现 的 次 数 . 注意 , X(w 
"出 的 不 是 正面 就 是 反面 . 这 上 暗示 了 男 一 个 随机 变量 , 即 正面 超出 反 


面 的 个 数 . 从 金钱 的 角度 出 发 , 现在 我 们 每 得 到 1 个 正面 就 能 拿 到 100 万 美元 , 但 每 


那么 X; 


X2(HHT) =1 并 


出 现 1 个 反面 就 必须 文 付 100 万 美元 . 这 个 随机 变量 就 是 1 000 000.(X(w) 一 Y(w)). 
最 后 , 我 们 再 看 三 个 函数 . 定义 函数 X; : 9 一 展 ; 如 果 第 ;次 掷 出 的 是 正面 ， 


(w) = 1; 如 果 第 ;次 掷 出 的 是 反面 , 那么 Xi(w) = 0. 于 是 , X1(HHT) = 1 


X(w) = Xi(w 


且 X3(HHT) = 0. 我 们 得 到 了 下 面 这 个 重要 的 关系 式 ; 


) 十 X2(w) + X3(w). 


也 就 是 说 , 掷 出 正面 的 总 数 就 等 于 第 1 次 掷 出 正面 的 次 数 加 上 第 2 次 掷 出 正面 的 


次 数 , 再 


加 上 第 3 次 掷 出 正面 的 次 数 . 


这 里 隐藏 着 一 个 很 重要 却 容易 被 忽略 的 问题 ,事实 上 , 这 个 问题 通常 难以 发 觉 
我 们 不 是 把 正面 相 加 , 而 是 把 正 而 出 现 的 次 数 加 起 来 这 是 个 
把 一 个 正面 和 一 个 反面 加 起 来 会 得 到 什么 ? 这 是 两 个 不 同 的 对 象 , 不 能 


分 重要 . 


对 它们 做 加 法 . 但 是 , 我 们 可 以 为 每 个 正面 指定 数字 1, 为 每 个 反面 指定 数字 0， 


然后 再 把 这 些 数 加 起 来 ，( 稍 后 我 们 会 看 到 , 在 某 些 问题 中 , 把 -1 指定 给 反面 


数 的 差别 , 却 十 


ay 


会 更 加 方便 . 这 取决 于 用 和 来 表示 正面 出 现 的 个 数 , 还 是 表示 正面 超出 反面 的 个 


数 .) 


里 然 我 们 还 没有 定义 随机 变量 , 人 


ol 


上 面 的 讨论 已 经 说 明了 为 什么 关于 结果 空间 


中 元 素 的 函数 是 实 值 函数 . 我 们 希望 用 较 简 单 的 函数 来 构造 更 加 复杂 的 函数 . 有 


上述 准备 , 现在 就 引入 离散 型 随机 变量 的 定义 . 


离散 型 随机 变量 : 离散 型 随机 变量 X 


就 是 定义 在 一 个 离散 的 结果 空间 8 (这 意味 
着 9 是 有 限 的 或 至 多 可 数 的 ) 上 的 实 值 函数 . 具体 地 说 , 我 们 为 每 个 元 素 we 9 


指定 了 一 个 实数 X(w). 


作为 男 一 个 例子 , 假设 我 们 抛 折 下 


颗 均 匀 且 相互 独立 的 山 子 , 并 让 R 表示 掷 出 


的 数字 之 和 . 由 于 每 颗 货 子 都 有 6 个 面 (各 面 数字 分 别 是 1 到 6), 因此 一 共有 36 种 
可 能 的 结果 , 即 从 (1,1) 到 (6,6), 并 且 2 颗 角 子 的 数学 之 和 有 11 种 结果 (最 小 的 和 


是 2, 最 大 的 和 是 12). 


因此 R((1,1)) = 2, R((3,5)) = 8. 简单 地 说 一 下 这 个 符号 表 


示 . 随机 变量 要 应 用 于 结果 
如 w= (3,5). 因此 R(w) 
帮助 我 们 看 清 


很 容易 只 写 R(3,5), 你 要 尽 


7.2 


到 目前 
可 以 构造 出 


且 个 二 


i 为 止 , 我 们 已 


I 一 个 3 


= R((, 


经 定义 了 随机 变量 


新 的 随机 变量 . 为 外 , 它 还 有 个 非 党 


空间 的 元 素 . 


时 避免 这 种 错 


让 
量 号 


离散 型 随机 变 


上 ,但 


2 


7TTR 旦 


日 分 3 


结果 衬 


间 


用 到 (3, 5) 


并 得 至 


: 概率 密度 函数 


P 的 元 素 是 成 对 出 现 日 
5)). 多 出 来 的 一 组 括号 看 起 来 有 点 充 诬 , 但 


楚 整 个 过 程 . 我 们 把 函数 瓦 1 了 输出 


的 , 比 


mz 会 已 


已 用 
bh 8. 这 里 


到 


并 看 到 两 个 (或 


三 元 组 . 它 不 仅仅 是 | 


古 ?| 


一 系列 结果 构成 


定义 了 概率 函数 (这 些 子 集 构成 了 o 代数 ). 


是 且 


重要 的 性 质 . 
的 集合 2; 我 们 还 在 9 的 


讨论 随机 变量 取 不 同 


多 个 ) 随机 变量 相 加 
记 人 


,概率 空间 
一 组 子 集 上 
值 的 概率 是 


有 意义 的 . 这 里 有 两 个 很 自然 的 问题 Prob(X = x) (随机 变量 的 值 恰好 是 x 的 概 
率 ) 是 多 少 , 以 及 Prob(X < x) (随机 变量 的 值 不 大 于 2 的 概率 ) 是 多 少 ? 

对 于 7.1 节 中 把 一 枚 均匀 的 硬币 抛掷 3 次 的 例子 , 我 们 有 Prob(X; = 1) = 1/2， 
Prob( Xi = 0) = 1/2, 并 且 X; 取 其 他 任意 值 的 概率 均 为 0. 当 考 虑 X 时 , 事情 会 变 
得 更 有 趣 , 这 里 的 X 就 是 把 一 枚 均匀 硬币 抛掷 3 次 后 出 现 正面 的 次 数 . 由 于 这 8 
个 结果 的 概率 是 相等 的 , 所 以 只 需要 数 一 数 “X 等 于 z” 出 现 了 几 次 , 然后 再 让 这 
个 结果 除 以 8 即 可 . 也 就 是 说 , 对 于 每 一 个 “出 现 了 z 次 正面 ”的 结果 , 我 们 都 乘 了 
1/8. 于 是 

Prob(X =0) = 1/8, Prob(X =1) = 3/8， 
Prob(X =2) = 3/8, Prob(X=3) = 1/8; 


X 取 其 他 任何 值 的 概率 都 是 0. 这 一 点 儿 也 不 奇怪 , 每 个 概率 都 是 非 负 的 , 并 


有 概率 之 和 就 是 1. 


现在 考 守 另 一 个 例子 . 我 们 仍 


概率 是 p, 出 现 反面 


LI 


巴 一 枚 硬币 


] 抛 撕 3 次 , 但 现在 人 


恨 设 它 昌 


且 所 


a 
H 


8 现 正 面 的 


的 概率 为 1 一 p. 为 了 强调 


括 这 枚 硬币 3 次 后 


Ll 


bt 现 正面 


的 次 数 . 用 字母 


不 均匀 的 (biased), 添加 下 标 


“Dp 是 为 了 强 


调 现在 
结果 空间 并 没有 改变 , 它 仍然 包含 8 个 事 


四 | 


与 p 的 相关 性 , 我 们 
是 为 了 
E 面 的 概率 是 p. 


蝇 


B 来 表示 随机 变量 
掷 出 1 


TTT、 TTH、 THT、 HTT、 THH、 HTH、 HHT 和 HHH. 


发 生变 化 的 是 概率 函数 . 如 果 p 关 1/2, 那么 这 8 个 寻 


。TTT 的 概率 是 (1 一 


人 


。TTH、THT 和 HTT 的 概率 均 为 p(1 一 四 2; 
。THH、HTH 和 HHT 的 概率 均 为 p?(1 一 p); 


用 B, 来 表示 抛 


强调 硬币 是 


有 件 的 概率 就 不 相等 了 . 
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。 最后, HHH 的 概率 是 p3. 
为 了 求 出 B, 等 于 2 的 概率 , 我 们 只 需要 把 THH、HTH 和 HHT 的 概率 加 起 来 就 


行 了 , 这 样 就 得 到 了 Prob(B, = 2) = 3p?(1 一 p). 为 了 看 得 更 清楚 , 我 们 设 p = 4/5 

(那么 掷 出 正面 的 概率 就 是 括 出 反面 的 4 倍 ). 于 是 
Prob(Bys = 0) = 1/125， Prob(Bys =1) = 12/125, 
Prob(Bys =2) = 48/125, Prob(Bys =3) = 64/125; 


Byjs 取 其 他 任何 值 的 概率 都 是 0. 就 像 上 一 个 例子 那样 , 这 些 概 率 的 和 是 1, 表明 
了 一 定 有 某 事 发 生 . 

虽然 可 能 出 现 的 结果 与 之 前 一 样 , 但 出 现 两 次 正面 的 概率 与 之 前 不 同 . 这 是 因 
为 两 种 情况 下 的 概率 函数 是 不 一 样 的 . 这 就 引出 了 下 一 个 与 随机 变量 相关 的 重要 
定义 , 即 概率 密度 函数 (probability density function, PDF). 


离散 型 随机 变量 的 概率 密度 函数 : 设 X 是 一 个 随机 变量 , 它 定 义 在 离散 的 结果 
空间 9 上 (9 是 有 限 的 或 至 多 可 数 的 ). 那么 X 的 概率 密度 函数 ( 常 记 作 fx) 就 
是 X 取 某 个 特定 值 的 概率 : 
fx(7x)= Prob(w € Q: X(w)= 2). 


注意 , 有 些 教材 用 概率 质量 函数 的 说 法 , 而 非 概 率 密度 函数 . 概率 密度 函数 的 值 
总 是 大 于 或 等 于 0, 并 且 和 始终 为 1. 
和 往常 一 样 , 我 们 要 说 点 与 符号 有 关 的 内 容 , 这 是 因为 不 同 的 教材 会 有 不 同 的 
风格 . 我 喜欢 在 概率 密度 函数 上 加 下 标 X, 它 可 以 提醒 我 们 这 个 密度 函数 与 随机 变 
量 X 有 关 . 特别 是 在 涉及 很 多 随机 变量 时 , 这 种 做 法 非常 有 用 . 
回 过 头 来 看 抛掷 一 枚 均匀 硬币 的 例子 , 它 有 个 不 错 的 概率 密度 函数 解析 式 . 回 
顾 一 下 , 非 零 的 概率 有 

Prob(X = 0) = 1/8, Prob(X =1) = 3/8, 

Prob(X =2) = 3/8, Prob(X =3) = 1/8. 


| 


上 面 的 式 子 可 以 简写 成 ee 
= 如果 ke {0,1,2,3 
Prob(X = k) = | W 8 | 


0 其 他 ， 


中 (%) = jcy 表示 从 n 个 物体 中 无 序 挑选 出 个 物体 的 方法 数 . 
检验 上 述 结果 的 正确 性 很 容易 : (3) = (3) = 1 且 (3) = (3) = 3. 但 是 , 只 做 
检验 并 不 能 带 给 我 们 很 大 启发 . 这 里 为 什么 会 有 二 项 式 系数 ? 如 果 使 用 不 均匀 的 硬 


币 , 还 能 得 到 类 似 的 答案 吗 ? 这 里 的 二 项 式 系数 源 于 我 们 要 确定 在 哪 几 次 抛掷 时 出 
现 了 正面 , 所 以 对 于 任何 硬币 都 有 类 似 的 公式 . 
我 们 考虑 一 枚 不 均匀 的 硬币 , 掷 出 正面 的 概率 是 p, 掷 出 反面 的 概率 是 1 一 yp. 
。 如 果 不 想得到 正面 , 那么 撕 出 的 结果 必须 都 是 反面 .没有 撕 出 正面 的 方法 
有 (0) = 1 种 .一旦 我 们 选 定 了 哪 几 次 搓 出 了 正面 , 那么 剩 下 的 几 次 就 一 
定 掷 出 了 反面 . 因为 掷 出 反面 的 概率 是 1 - 2, 所 以 没有 掷 出 正面 的 概率 是 
(0)(1 一 人 3. 
。 要 想 恰 好 掷 出 一 个 正面 , 我 们 必须 确定 在 三 次 抛 抑 中 , 哪 一 次 掷 出 了 正面 
这 有 (7?) = 3 种 可 能 性 . 每 次 掷 出 正面 的 概率 是 p, 每 次 搓 出 反面 的 概率 是 
1 一 p. 因此 , 恰好 掷 出 一 个 正面 的 概率 就 是 (3)p(1 一 p)? = 3p(1 一 p)?. 此 时 ， 
有 (3) 种 可 能 情况 , 即 TTH、THT 和 HTT, 它们 的 概率 是 相等 的 , 都 等 于 
p(1 —p)?. 
e。 恰好 掷 出 两 个 正面 的 情况 几乎 与 恰好 掷 出 一 个 正面 的 情况 完全 相同 , 其 概 
率 为 (2)p2(1 一 p). 
e。 对 于 掷 出 三 个 正面 的 情况 , 其 处 理 方法 与 “没有 掷 出 正面 > 的 处 理 方法 类 似 ， 
这 种 情况 发 生 的 概率 为 (3)p3. 
如 果 令 p = 4/5, 那么 我 们 仍 会 得 到 前 面 的 公式 . 这 被 称 为 (参数 为 3 和 4/5 
的 ) 二 项 分 布 ; 在 12.2 节 中 , 我 们 会 更 加 深入 地 讨论 它 , 但 现在 先 给 出 简单 的 介绍 
如 果 能 找到 一 个 解析 表达 式 就 好 了 , 这 样 就 能 通过 简单 的 替换 来 计算 任何 概率 . 稍 
后 我 们 会 证 明 , 当 抛 括 nw 枚 硬币 时 , 如 果 每 次 橱 出 正面 的 概率 都 是 p, 那么 对 于 任 
意 的 有 € {0,1,… ,nj}, 恰好 搓 出 到 个 正面 的 概率 就 等 于 (?)p*(1 - DA 而 其 他 
情况 的 概率 均 为 0. 所以, 处 理 这 个 分 布 会 相当 轻松 , 因为 我 们 清楚 地 知道 每 个 概 
率 的 计算 公式 . 
回顾 一 下 抛掷 两 颗 均 匀 骨 子 的 例子 . 事实 上 , 这 里 有 一 个 很 好 的 概率 密度 函数 
公式 . 在 36 对 结果 中 , 每 1 对 发 生 的 概率 均 为 1/36. 让 R 表示 两 颗 肯 子 的 数字 之 
和 ; 为 了 得 到 R 等 于 7 的 概率 , 我 们 只 需要 数 一 数 和 为 ” 的 数 对 有 多 少 个 . 在 表 

7-1 中 , 我 们 给 出 答案 . 仍 要 注意 , 每 个 概率 都 是 非 负 的 , 并 且 全 体 概率 之 和 为 1. 
注意 数 的 规律 : 1/36、2/36、3/36, 一 直 增 加 到 6/36, 然后 又 减少 到 1/36. 你 也 

可 以 通过 查看 上 下 文 来 找 出 这 种 规律 ! 可 以 把 上 述 结果 简写 成 
6 一 上 了 一 7 
Prob(R=7)= | 让 / a 
0 其 他 . 


在 起 始点 7 = 2 处 , 绝对 值 取 到 最 大 值 ; 然后 线性 减少 到 它 的 最 小 值 ; 即 x =7 的 
取 值 , 接着 又 线性 增加 , 直到 在 x = 12 处 取 到 最 大 值 . 于 是 , 当 7 = 7 时 , 概率 取 到 
了 最 大 值 6/36 (因为 此 时 没有 减 去 任何 东西 ); 当 7=2 或 + = 12 时 , 概率 取 到 了 
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最 小 值 1/36. 


独立 地 抛掷 两 颗 均 匀 的 贷 子 ， 得 到 的 数字 之 和 的 概率 . 表格 的 形状 暗示 了 不 同事 


、(4,2) 和 (5,1). 
,4)、(4,3)、(5,2) 和 (6,1). 
、(5,3) 和 (6,2). 


不 到 把 答案 写成 这 种 简洁 的 形式 , 也 不 必 担 心 . 这 种 规律 并 不 容易 看 出 


究 的 问题 越 多 , 你 就 越 容易 发 现 更 多 的 规律 . 比如 , 我 们 再 看 看 这 些 数 ， 


表 7-1 
件 概率 的 大 小 
e Prob(R 二 2) = 1/36, 来 自 于 数 对 (1,1). 
e Prob( 尺 = 3) = 2/36, 来 自 于 数 对 (1,2) 和 (2,1). 
e Prob( 尺 = 4) = 3/36, 来 自 于 数 对 (1,3)、(2,2) 
e Prob( 尺 = 5) = 4/36, 来 自 于 数 对 (1,4)、(2,3) 
e Prob( 尺 = 6) = 5/36, 来 自 于 数 对 (1,5)、(2,4) 
e Prob( 尺 =7) = 6/36, 来 自 于 数 对 (1,6)、(2,5)、 
e Prob( 尺 = 8) = 5/36, 来 自 于 数 对 (2,6)、(3,5)、 
e Prob( 尺 = 9) = 4/36, 来 自 于 数 对 (3,6)、(4,5)、 
e Prob( 尺 = 10) = 3/36, 来 自 于 数 对 (4,6)、(5,5 
e Prob( 尺 = 11) = 2/36, 来 自 于 数 对 (5,6) 和 (6,5). 
e Prob(R = 12) = 1/36, 来 自 于 数 对 (6,6). 
如 果 想 
来 . 但 是 ,而 
并 试 着 找 出 能 帮助 我 们 求 出 答案 的 线索 . 尘 


中 的 7 就 是 2 和 12 


而 其 他 情况 的 概率 均 为 0. 考察 这 个 结果 的 一 种 角度 是 , 当 7 增加 时 , 只 要 + 没有 
青 况 就 比 之 前 多 了 一 种 . 当 超过 中 点 时 , 它 每 增加 一 次 , 相应 


到 达 中 点 , 那么 可 能 | 


FE 意 , 7 的 取 值 范围 是 从 2 到 12, 而 |7 一 7| 
的 平均 值 . 如 果 现 在 有 两 颗 均 匀 的 山 子 ， 
面 , 那么 当 7 e {2,3,… ,2n} 时 , 掷 出 的 数字 之 和 为 ” 的 概率 应 该 就 是 呈 王 +， 


并 且 每 颗 山 子 都 有 


n2 


的 可 能 性 就 少 了 一 种 . 


0 


现在 已 经 取得 了 很 大 进展 . 我 们 已 经 考察 了 两 个 例子 , 甚至 看 出 了 该 如 何 推广 


它们 . 遗憾 的 是 , 我 们 只 


在 某 些 方面 做 了 推广 ， 例 如 , 在 撕 骨 子 的 问题 中 , 我 们 增 


加 了 每 颗 骨 子 的 面 数 . 另外 一 种 改动 是 增加 骨 子 的 数量 . 随 着 角子 数 量 的 增加 , 这 


些 公式 会 变 得 更 加 复杂 . 幸运 的 是 , 在 很 多 问题 中 , 我 们 不 需要 知道 每 个 结果 的 确 
切 概率 ,只 要 了 解 某 个 特定 范围 内 结果 的 概率 就 行 了 ， 这 就 引出 了 第 20 章 的 了 
题 一 一 中 心 极限 定理 . 
下 面 给 出 一 个 不 错 的 练习 , 


本 


一 颗 均匀 的 骨 子 抛掷 3 次 , 试 着 计算 掷 出 的 数字 


之 和 的 概率 密度 函数 ; 然后 考察 抛掷 4 次 的 情况 . (提示 : 抛 撕 4 次 的 情况 实际 上 


要 比 抛 括 3 次 的 情况 更 容易 , 因为 我 们 可 以 把 抛掷 4 次 的 结果 


7.3 


现在 回顾 一 下 我 们 在 前 几 节 所 做 的 寻 


两 分 组 .) 


离散 型 随机 变量 : 累积 分 布 函数 


情 . 我 们 定义 了 离散 型 随机 变量 和 它们 的 


概率 密度 函数 . 两 个 主要 的 离散 型 随机 变量 的 例子 是 , 把 一 枚 均匀 的 硬币 抛 找 3 次 


计算 了 相应 的 概率 密度 函数 . 


后 出 现 正面 的 次 数 , 以 及 两 颗 均 匀 骨 子 掷 出 的 数字 之 和 . 对 于 每 一 个 例子 , 我 们 都 


另外 一 个 非常 重要 的 相关 概念 是 累积 分 布 函数 (cumulative distribution func- 


tion, CDF). 虽然 这 个 概念 对 连续 型 随机 变量 更 有 用 , 但 它 在 离散 型 随机 变量 方面 
仍 有 些 用 途 , 因此 值得 研究 . 在 深入 讨论 CDF 之 前 , 我 们 先 快速 预览 一 下 它 能 带 给 


我 们 什么 . CDF 是 一 种 非常 有 


其 帮助 下 , 我 们 能 利用 熟悉 的 随机 变量 


入 的 工具 ， 在 


[> 


来 了 解 一 个 新 的 随机 变量 . 这 被 称 为 累积 分 布 函数 法 , 我 们 将 在 13.2.4 节 中 给 出 相 


个 特定 值 的 概率 . 它们 分 别 记 作 


离散 型 随机 变量 的 累积 分 布 函数 : 设 X 是 一 个 随机 变量 ， 
或 至 多 可 数 的 离散 结果 空间 9 上 .回忆 一 下 , X 的 概率 密度 函数 ( 常 记 作 fx) 
就 是 X 取 某 个 特定 值 的 概率 . 累积 分 布 函数 ( 常 记 作 Fx) 则 表示 X 不 超过 某 


jx(zZ) = Prob(w EQ: X(w)= 7) 
Fx(x) = Prob(w €E 0: X(w) < 7). 


它 定 义 在 一 个 有 限 的 


我 们 之 前 讨论 过 PDF 的 符号 , 并 解释 了 下 标的 意义 在 于 帮助 我 们 记 住 随机 变 


量 与 概率 密度 函数 之 间 的 关联 . 好 了 , 这 就 对 下 标 做 出 了 解释 . 为 什么 


忆 大 写 池 母 


来 表示 累积 分 布 函数 呢 ? 这 种 写法 来 源 于 微 积 分 . (另外, 我 们 稍 后 会 看 到 , 这 暗示 


了 为 什么 CDF 对 连续 型 随机 变量 更 有 月 


日.) 在 微 积 分 中 , 我 们 党 


用 f 表示 函数 , 用 


已 表示 f 的 原 函 数 , 并 且 玉 与 曲线 下 方 的 面积 有 关 . 这 里 的 情况 与 之 类 似 ( 当 讨 
论 连续 型 随机 变量 时 , 我 们 会 看 到 这 种 关联 会 更 加 明显 )， 累 积分 布 函数 是 把 某 个 


给 定点 之 前 的 所 有 概率 都 加 起 来 , 这 与 积分 非常 相似 , 从 而 解释 了 我 们 为 什么 会 采 


用 这 种 符号 . 和 往常 一 样 , 我 们 有 必要 人 花 时 间 来 思考 


才能 在 快速 济 


Ar 


览 时 清楚 地 知道 每 个 量 都 代表 了 什么 . 


下 


们 三 ， 


做 出 


些 选择 , 这 样 


现在 把 一 枚 均匀 的 硬币 抛 撕 3 次 . 设 Fx 表示 累积 分 布 函数 , 那么 Fx(z) = 


Prob(X < 7). 


注意 , 累积 分 布 函数 是 不 连续 的 , 它 在 0、1、2 和 3 处 出 现 了 跳跃 . 我 们 在 图 


于 是 


0 若 z<0 
1/8 若 0<z<1l 

Fx(7x) = 4 4/8 若 1<xz<2 
7/8 若 2<z<3 
1 若 x>>3. 


7-1 中 绘制 了 随机 变量 X 的 PDF 和 CDF. 
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一 4 一 2 


图 7-1 抛掷 一 枚 均匀 的 硬币 3 次 ， 


0 


2 


4 


T 


一 1.0 ”一 0.5 0.5 1.0 1.5 2.0 


( 左 图 ) 和 累积 分 布 函数 ( 


如 果 出 现 更 多 正面 , 昼 
面 的 次 数 会 有 一 个 “不 错 的 ”累积 分 布 函数 公式 . 当 € {0,1,… 


右 图 ) 


了 么 情况 会 更 糟糕 


把 


随机 变量 X 表示 出 现 正 面 的 次 数 : X 的 概率 分 布 函数 


枚 均匀 的 硬币 抛 撕 ”次 , 出 现 正 


,7} 时 , 恰好 出 现 


k 次 正面 的 概率 就 是 fx(k) = (7?)(1/2)*(1 一 1/2)”* = (2)1/2". 累积 分 布 函数 Fx 
就 是 把 给 定点 之 前 的 所 有 概率 都 加 起 来 . 于 是 
0 若 m<0 
Fx(m) = 9 车 0<m<n 
二 
1 若 m 之 刀 . 


遗憾 的 是 , 对 于 二 项 式 系数 的 部 分 和 , 我 们 找 不 到 一 个 好 的 、 简 单 的 解析 表达 式 . 当 


然 , 如 果 不 对 二 项 式 系数 做 加 法 , 或 者 把 全 体 二 项 式 系数 都 加 起 来 , 那 就 能 得 到 一 


个 不 错 的 表达 式 . 


我 们 考虑 更 一 般 的 ' 


青 况 , 它 会 


给 出 关于 累积 分 布 函 数 的 一 般 结论 . 假设 现在 有 


n 枚 硬币 , 每 一 枚 硬币 掷 出 正面 的 概率 都 是 p, 掷 出 反面 的 概率 都 是 1-p. 设 X 是 


一 个 随机 变量 , 等 于 正面 出 


no- -fmer， 


当 给 出 概率 密度 函数 时 , 我 们 使 月 
. 标准 惯 伪 


么 字母 表示 并 不 重要 


本 


| 是 


8 现 的 次 数 . 我 们 已 经 讨 


k 


企 过 X 的 概率 密度 
如 果 ke€ {0,1,:… ,n} 


其 他 . 


的 是 X=, 而 不 是 X = x. 随机 变量 的 值 用 什 
有 i、j、k、l、m 和 nn 这样 的 字母 表示 整数 , 用 


Zz、y 和 z 这 样 的 字母 表示 实数 . 这 些 都 无 所 谓 , 但 使 用 而 不 用 x 是 有 一 定好 处 


的 , 因为 它 能 提醒 我 们 X 的 值 

为 了 求 出 累积 分 布 函数 Fx 在 m 处 的 值 ， 
数 的 概率 加 起 来 就 行 了 . 如 果 m < 0, 那么 这 个 术 
m, Fx(m) = 0. 如 果 m >m, 那么 由 二 项 式 定理 ( 


可 知 , 这 个 概率 和 为 1， 


因为 


是 整数 . 


我 们 只 需要 把 满足 k < m 的 全 体 整 


既 率 和 就 是 0. 因此 , 对 于 这 样 的 


内 容 和 证 明 请 参阅 定理 A.2.7) 


©O 


>》， (ro —p" “= (p+(1—p))"=1. 
k=0 


这 里 有 一 个 需要 说 明 的 重要 事实 . x 处 的 累积 分 布 函数 就 是 随机 变量 不 超过 x 
的 概率 . 当 随 机 变量 只 能 取 有 限 多 个 值 时 (比如 , 两 颗 角 子 撕 出 的 数字 之 和 , 或 者 抛 
撕 n 枚 硬币 出 现 正面 的 次 数 , 又 或 者 抛掷 n 次 后 出 现 正面 的 次 数 减 去 出 现 反面 的 
次 数 ), 如 果 zx 足够 大 且 为 负数 , 那么 x 及 其 之 前 的 点 的 累积 分 布 函数 都 为 0; 同 
样 , 如 果 > 足够 大 且 为 正 数 , 那么 x 及 其 之 后 的 点 的 累积 分 布 函数 就 等 于 1. 例如 ， 
抛掷 一 枚 硬币 n 次 , 考察 出 现 正面 的 次 数 减 去 出 现 反面 的 次 数 . 当 zx 小 于 -mm 时 ， 
由 于 随机 变量 的 值 不 可 能 比 -n 小 , x 处 的 累积 分 布 函数 就 是 0; 类 似 地 , 当 x 大 
于 n 时 , z 处 的 累积 分 布 函 数 就 是 1, 这 是 因为 正面 减 去 反面 的 次 数 不 可 能 超过 nn. 


累积 分 布 函数 的 极限 : 设 Fx 是 离散 型 随机 变量 X 的 累积 分 布 函数 . 那么 


lim Fx(7x)=0, lim Fx(7x)=1, 


如 果 vy > zx, 那么 Fx(y) > Fx(z). 

当 随 机 变量 定义 在 一 个 离散 的 集合 上 时 , 我 们 也 必须 使 用 上 述 极限 . 我 们 通过 
一 个 例子 来 说 明 极 限 的 必要 性 ; 也 就 是 说 , 存在 一 个 随机 变量 X, 使 得 对 于 任意 
个 有 限 的 xz, 均 有 0 < _Fx(z) < 1. 这 里 要 用 到 几何 级 数 公 式 (更 多 内 容 请 参阅 1.2 
节 ), 我 们 快速 地 回顾 一 下 . 几何 级 数 公 式 有 两 个 版 本 , 一 个 包含 了 有 限 多 项 , 另 一 
个 包含 了 无 限 多 项 . 包含 有 限 多 项 的 公式 为 


. 
可 Qar® 一 arit! 
> ar” 一 一 一. 
工 一 7 
郊 王 关 


当 |r| < 1 时 , 我 们 可 以 让 7 趋 近 于 无 穷 大 , 从 而 得 到 
2 k 
> 人 这 7 
个 三 不 
假设 结果 空间 9 是 由 全 体 整 数 构成 的 集合 . 当 n = 0 时 , n 的 概率 就 是 0; 当 
夫 0 时 , 其 概率 为 1/2Im+1. 根据 几何 级 数 公式 , 不 难看 出 这 确实 是 一 个 概率 函数 . 
它 显然 是 非 负 的 , 接 下 来 只 需要 验证 概率 和 为 1 就 行 了 . 由 对 称 性 可 知 , 正 项 和 就 
等 于 负 项 和 , 所 以 只 需要 证 明 n > 1 时 的 概率 和 为 1/2. 利用 无 限 多 项 的 几何 级 数 
公式 , 我 们 看 到 


2 1 1 1/2 1 


1 1 
区 5 上 2 21-1/2 2 


= n=1 


7.3 ”离散 型 随机 变量 : 累积 分 布 函 数 ”237 


因此 这 是 概率 函数 . 

现在 来 计算 累积 分 布 函数 Fx(m). 我 们 分 别 考 虑 如 下 三 种 情况 : m = 0, m 是 
正 数 , 以 及 m 是 负数 . 由 对 称 性 可 知 , Fx(0) = 1/2. 当 m 为 正 数 时 , 由 于 全 体 负数 
的 概率 和 是 1/2, 所 以 我 们 只 需要 求 出 0 到 m 的 概率 和 , 然后 再 加 上 1/2 就 行 了 . 
对 于 正 整数 m, 我 们 有 


el 1 1/4 一 17/2m+2? 1 
Fx(m) = i = 十 TI 二 172 三 计 ti 
k=1 


如 果 m= 一 |m| 是 负数 , 情况 又 如 何 呢 ? 此 时 有 
一 |mm| 


1 TS 1 17/2Im| 1 
Fx(—|ml|) = 人 21k|+1 二 3 2 Dk 一 21—1/2 2|m| 


=|ml 


简单 地 验证 一 下 就 能 看 出 , 这 是 合理 的 : 如 果 m = 一 1, 那么 Fx (lml) 就 等 于 1/2, 
这 恰好 印证 了 取 负 值 的 概率 是 1/2. 另外 , 如 果 [7] 表示 实数 ” 的 地 板 函数 ( 即 不 
大 于 + 的 最 大 整数 ), 那么 Fx(7) = 本 (lrj), 这 足以 找 出 整数 点 处 的 累积 分 布 函 数 
于 是 


1/2I™| 若 m 是 负 整数 
Fx(m)= $4 1/2 车 m=0 
1 —1/2™+1 若 m 是 正 整 数 . 
我 们 确实 得 到 了 
A PN) = 0 im Fx(m) = 1 


然而 , 对 于 任意 一 个 有 限 的 m, 均 有 0 < Fx(m) < 1. 因此 , 只 有 当 m 取 负 无 穷 大 
时 , Fx(m) 才 会 等 于 0; 只 有 当 mm 取 正 无 穷 大 时 , Fx(m) 才 会 等 于 1. 这 就 是 取 极 
限 的 原因 

在 讨论 最 后 的 例子 之 前 , 我 们 先 回 忆 一 个 与 整数 和 有 关 的 事实 : 如 果 ”是 非 负 


整数 ,那么 
n(n+t+1) 
> 于 2 
k=1 


A.2.1 节 给 出 了 相关 证 明 , 现在 我 们 来 简单 地 推导 一 下 . 给 出 数 1,2,…… ,n, 然后 让 
它们 分 别 加 上 n,n 一 1,… ,1. 这 样 就 得 到 了 n 对 数 , 并 且 每 一 对 的 和 均 为 n 填 1. 
把 这 些 数 全 加 起 来 就 等 于 n(n 十 1), 这 正 是 目标 和 的 2 倍 , 因此 我 们 想 求 的 和 就 等 
于 n(n 十 1)/2. 如 果 用 符号 来 表示 , 设 5 是 我 们 想 要 计算 的 和 , 那么 


25 = (1 十 十 四) 十 (2 十 十 = (十 人 十 十 (二 1) = n(n+1), 


于 是 5 = nn + 1D)/2. 利用 这 个 结果 , 我 们 能 求 出 若干 个 连续 数 的 和 ; 
a n(n 1) (m= Dm 


2 2 
k=1 l=1 

上 面 的 论述 是 “从 至 少 到 恰好 方法 ”的 另 一 个 例子 . 利用 这 种 方法 , 我 们 让 “至少 
得 到 天 个 ”的 概率 减 去 “至 少 得 到 大 十 1 个 ”的 概率 , 这 样 就 求 出 了 “恰好 得 到 
个 ”的 概率 . 本 书 所 涉及 的 方法 都 不 是 孤立 的 技巧 ; 在 不 断 学 习 的 过 程 中 , 你 会 一 
次 又 一 次 地 用 到 这 些 强大 的 技巧 . 

现在 考察 最 后 一 个 例子 , 我 们 回 到 撕 肯 子 的 问题 . 在 7.2 节 中 , 我 们 计算 了 把 一 
颗 均 匀 的 人 般 子 抛掷 2 次 后 得 到 的 数字 之 和 的 概率 密度 函数 , 它 就 是 


6—|r—7| 4 

eA 若 r€ {2,3,.….,12 
Prob(R=7) = 36 机 } 

0 其 他 . 


这 本 书 的 主题 之 一 就 是 要 说 明 : 一 个 表达 式 通 常 有 很 多 不 同 的 写法 ; 有 时 候 , 某 种 
号 法 会 比 其 他 写法 更 具 启 发 性 . 由 于 绝对 值 很 难 进行 加 法 运算 , 我 们 更 喜欢 把 上 述 
概率 写成 ea 


Prob(R=7)= | 人 7 


车 7 € {2,3,.… ,7} 


3 若 7€ {7,8,.… ,12} 
另外 , 当 7 取 其 他 值 时 , 概率 均 为 0. (注意 , 上 面 两 个 式 子 在 + = 7 时 是 一 样 的 , 所 
以 使 用 哪 一 个 都 行 .) 
现在 , 通过 计算 连续 整数 的 概率 和 , 我 们 可 以 得 到 累积 分 布 函数 FRR. 显然 , 当 
m 小 于 2 时 , Fr(m) = 0. 对 于 即将 要 看 到 的 和 , 一 开始 它 是 7 遍历 2 和 m 之 间 所 
有 整数 的 概率 和 ; 接着 要 进行 变量 替换 , 把 它 变 成 1 遍历 1 和 m 一 1 之 间 所 有 整数 
的 和 . 这 使 得 每 个 x 都 要 被 替换 成 1+1 (也 就 是 说 , 我 们 把 > 写成 了 r=1+1, 那 
么 1=7+ 一 1). 当 2< m7 时 ,我们 有 


m m—1 
r—1 1 1 (mo— 1)m (m— 1)m 
RUm) 2 36 36 2 36 2 72 


7 被 替换 成 了 1 = 7 一 1. 这 里 不 一 定 使 用 字母 1, 也 可 以 使 用 其 他 任何 一 个 字母 . 遗 
憾 的 是 , 标准 约定 要 求 我 们 使 用 同一 个 字母 (在 本 例 中 是 ”). 虽然 很 多 书 会 直接 把 
r 蔡 换 成 > 一 1, 但 我 发 现 这 会 让 许多 学 生 在 学 习 这 部 分 内 容 时 产生 混淆 . 虽然 这 种 
做 法 没有 什么 坏处 , 因为 > 只 是 个 虚拟 变量 , 却 潜伏 着 一 个 危险 , 那 就 是 不 同位 置 
的 7 代表 着 不 同 的 含义 . 

当 m >> 8 时 , Fa(m) 是 多 少 呢 ?我 们 已 经 知道 ,> < 7 时 的 概率 和 是 (5 过 = 也 ， 
所 以 现在 只 需要 把 这 个 值 加 上 8 < 7 < m 时 的 概率 和 就 行 了 . 当 m e {8,9,…… ,12} 
时 , 有 
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你 13 一 7 
Fr(m) = 15 - >， 36 
+ 
5 
pe 
12 36 > | 
[=13—m 
rf 1 /5(5+1) (13—m—1)(13—m) 
12 36 2 2 
| (13—m—1)(13—m) 
三 人 . 
综 上 所 述 , 我 们 有 
0 若 m<2 
= rg 
二 人 —m—1)(13—m) 
1 二 若 meE{7,8 ,12} 


1 若 m 12. 


尽量 去 检验 你 的 答案 ! 注意 , 当 m = 7 时 , 这 两 个 表达 式 是 一 样 的 . 此 外 , 当 
m = 12 时 , 我 们 得 到 了 不 错 的 结果 , 即 Fa(12) = 1, 这 是 因为 两 颗 山 子 掷 出 的 数字 
之 和 不 可 能 大 于 12. 因此 , 我 们 的 代数 运算 应 该 是 正确 的 . 
当 我 们 想 通过 编写 代码 来 寻找 答案 时 , 检验 是 非常 重要 的 . 我 们 想 弄 清楚 如 何 
将 真实 的 场景 变 成 一 些 数 , 进而 编写 代码 . 根据 想 要 得 到 的 结果 , 我 们 可 以 把 反面 
设 为 0、 正面 设 为 1, 也 可 以 把 反面 设 为 -1、 正面 设 为 1. 现在 给 出 另 一 个 例子 , 考 
虑 一 副 牌 . 这 副 牌 可 以 被 看 作 一 个 集合 , 可 以 通过 把 1 到 13 的 每 个 数 近 代 4 次 而 
得 到 ; 我 们 也 可 以 认为 它 是 由 1 到 52 的 全 体 整 数 构成 的 集合 , 并 且 每 13 张 牌 被 
看 作 一 种 花色 . 
下 面 是 一 些 Mathematica 代码 , 它 可 以 创建 两 颗 人 般 子 掷 出 的 数字 之 和 的 柱状 
图 . 通过 大 量 模拟 , 我 们 应 该 对 真实 值 有 非常 精确 的 估计 , 还 可 以 把 模拟 数据 与 预 
测 值 进行 比较 . 
diceroll[num_] := Module[{}, 
allsums = {}j; (* 此 处 存储 和 *) 
For[n = 1, n <= num，n++，(# 主 循环 *) 
{ 
(* 每 当 进度 达到 10% 时 ， 下 面 几 行 就 输出 1 次 *) 
(* 当 运 行 长 代码 时 ， 这 是 个 很 好 的 技巧 ,我们 可 以 清楚 地 知道 已 经 完成 了 
多 少 *) 
If[Mod[n, num/10] == 0， 


Print["Have done ", 100. n/num, "%."]]; 


| 
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diel = RandomInteger[{1，6}]; (* 选取 第 一 颗 咒 子 的 点 数 *) 
die2 = RandomInteger[{1，6}]; (* 选取 第 二 颗 咒 子 的 点 数 *) 


AppendTo [allsums，diel + die2]; (* 把 它们 的 和 添加 到 列表 中 *) 


}]; 


For[i = 2, i <= 12，i++， 
(* 计算 掷 出 i 的 概率 *) 
(* 为 此 ，Mathematica 有 个 很 好 的 计数 函数 *) 

(* 如 果 不 使 用 这 个 函数 ， 那么 可 以 遍历 列表 并 记录 每 个 数 出 现 的 频率 *) 
(* 也 可 以 在 生成 diel+die2 时 更 新 计数 *) 
(* 这 样 做 是 因为 需要 利用 列表 画 出 柱状 图 *) 


Print["Percent of time rolled ", i, " is "， 


100.0 Count[allsums, i]/num, "%, and theory 
predicts ", 100.0 (6 - Abs[7 - i])/36, "%."]; 


]; 


(* 打印 柱状 图 并 按 比例 进行 缩放 ， 从 而 使 得 曲线 下 的 面积 为 1 *) 
Print [Histogram[allsums, Automatic, "Probability"]]; 


] 。 
Timing[diceroll[100000]] (* 运 和 


在 编码 时 , 列 出 你 正在 做 的 事 


一 利 


很 好 的 做 法 , 但 


是 要 小 心 . 对 列 


并 计算 程序 所 需 的 时 间 *) 
情 并 通过 试验 来 丰 


有 保 代 码 能 给 出 你 想 要 的 答案 是 


表 进 行 


处 理 # 


把 它 保 存在 内 存 中 要 付出 很 高 的 


代价 . 在 这 个 程序 中 , 抛掷 10 000 次 要 花费 0.31 秒 , 抛掷 100 000 次 要 花费 19.69 


秒 , 抛掷 200 000 次 要 花费 79.64 秒 . 这 里 
有 太 多 耐心 , 我 放弃 了 抛掷 100 万 次 的 情况 . 这 么 简单 的 题目 
大 型 列表 的 代价 很 高 , 而 且 会 大 大 降低 计算 机 的 运行 速度 . 就 这 个 问题 而 言 ， 
门 只 想 知道 得 到 每 个 和 的 概率 
P, 不 如 构造 一 个 


没 必 
次 序 . 


了 王 
x 


因此 , 与 其 将 


保存 所 有 的 值 , 我 


二 用 
结果 


12) 及 增 量 的 数组 , 如 下 列 代码 所 示 


betterdiceroll [num_] 


F 
F 


or[i = 2, i <= 
or[n = 1, n <= 


{ 


(* 每 当 进 度 达 到 10% 时 就 输出 1 次 ; 当 


习惯 *) 


If[Mod[n, num/10] == 0, Print['"Have done ",， 


diel 
die2 


roll 


:= Module[{}, 


保存 在 列表 


消耗 和 


num，n++，(# 主 循环 *) 


网 过 


运行 


的 时 间 绝 不 是 线性 增加 的 ; 由 于 
哪 


没 
里 出 问题 了 ? 存储 

真 的 
有 多 大 , 并 不 关心 和 出 现 的 
包含 11 个 可 能 结果 (从 2 到 


12，i++，number[i] = 0]; (* 将 计数 初始 化 为 0 *) 


时 间 较 长 时 ， 这 是 个 不 错 的 


100. n/num, "%."]]; 


RandomInteger[{1，6}] ; (* 选取 第 一 颗 咒 子 的 点 数 *) 
RandomInteger[{1，6}]; (* 选取 第 二 颗 鹏 子 的 点 数 *) 
diel + die2; (* 求 和 且 相 应 计数 加 1 *) 
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number [rol1] = number [rol1] + 1; 
于 3 
list = {; (* 在 列表 中 存储 每 个 和 的 概率 *) 
For[i = 2, i <= 12，i++， 
{ 
list = AppendTo[list, {i, 100.0 number[i]/num}]; 


Print["Percent of time rolled ", i, " is ", 100.0 number [i]/num, 
"%, and theory predicts ", 100.0 (6 - Abs[7 - i])/36, "%."]; 
1]: 
Print [ListPlot [list]]; (* 输出 列表 *) 
]3 


Timing[betterdiceroll[100000]] (* 运行 并 计算 程序 所 需 的 时 间 *) 
抛掷 100 000 次 花费 了 0.72 秒 , 抛掷 100 万 次 花费 了 6.8 秒 . 注意 , 随 着 抛掷 
次 数 的 增加 , 这 里 的 运行 时 间 确 实 是 线性 增长 的 . 


7.4 总 结 


在 本 章 中 , 我 们 遇 到 了 主要 的 研究 对 象 之 一 , 即 离 散 型 随机 变量 ; 在 下 一 章 则 
将 看 到 连续 型 随机 变量 . 离散 型 随机 变量 可 以 用 来 解决 各 种 类 型 的 问题 . 我 们 可 以 
为 结果 空间 中 的 每 个 事件 指定 一 个 数 ; 比如 , 气象 站 的 温度 , 盒子 里 的 压力 , 以 及 培 
养生 中 细菌 的 数量 . 但 是 , 为 了 发 挥 其 作用 , 我 们 要 想 办 法 提取 出 这 些 随机 变量 的 
相关 信息 . 这 样 就 引入 了 概率 密度 函数 . 

在 电影 《 回 到 未 来 》 中 , 乔治 ”麦克 弗 莱 的 口误 很 好 地 强调 了 随机 变量 的 真实 
性 质 . 

洛 伦 : 嗨 , 我 是 不 是 见 过 你 ? 
乔治 : 是 的 , 没 错 , 我 是 乔治 , 乔治 麦克 费 莱 , 我 是 你 的 密度 (density). 
我 是 说 , 我 是 你 命中 注定 的 人 (destiny). 

我 们 用 “命中 注定 ”来 表示 一 定 会 发 生 的 事 , 这 是 预先 设 定 的 一 系列 事件 . 在 
影片 中 , 乔治 暗恋 洛 伦 . 他 好 不 容易 鼓 起 勇气 和 洛 伦 说 话 , 但 因为 过 于 紧张 而 说 错 
了 . 乔治 想 要 表达 的 是 , 他 们 是 天 生 一 对 , 命中 注定 会 认识 彼此 . 但 是 , 他 却 使 用 了 
“密度 ”这 个 词 . 密度 是 用 来 讨论 随机 变量 的 , 描述 的 是 各 种 可 能 性 发 生 的 概率 . 
虽然 这 两 个 词 相距 甚 远 , 但 事实 证 明 这 两 个 概念 结合 在 一 起 却 是 非常 强大 的 . 
我 最 喜欢 的 例子 之 一 是 3z 十 1 的 问题 . 从 一 个 正 整 数 ao 开始 , 把 ao 看 作 一 粒 种 
子 . 接 下 来 , 我 们 定义 下 面 这 个 序列 

3au 十 1 如 果 oa 是 奇数 
So 如 果 a 是 偶数 


不 难看 出 , 一 旦 出 现 了 1, 我 们 就 会 陷入 从 1 到 4、 再 到 2、 接 着 又 到 1 的 无 限 循 环 
中 .可 以 推测 , 无 论 开 始 选择 哪个 正 整数 作为 种 子 , 最 终 都 会 陷入 这 个 循环 中 .对 
于 任意 一 个 给 定 的 整数 , 将 要 发 生 的 事 都 已 经 预先 注定 了 (如 果 这 个 过 程 终止 , 那 
么 在 经 过 足够 的 达 代 后 我 们 也 能 发 现 这 个 规律 ); 每 粒 种 子 都 有 它 注定 的 命运 . 然 
而 , 我 们 可 以 通过 研究 一 个 相关 的 系统 来 获得 更 多 信息 . 

注 ”从 技术 角度 上 看 , 研究 下 面 这 个 相关 序列 会 更 加 方便 : 

bn+1 = 其 中 2*|3b% 十 1 但 是 2*T1413b, 十 于 

换 句 话说, 我 们 从 一 个 奇数 开始 , 让 它 乘 以 3, 再 加 上 1 (这 给 出 了 一 个 偶数 ), 然后 
再 尽 可 能 多 地 删除 2 的 方 老 . 注意 , 如 果 b,, 是 奇数 , 那么 3b 十 1 就 是 偶数 , 因此 
一 定 有 2 的 方 徊 被 删除 . 假设 只 能 删除 一 个 2 的 概率 是 1/2, 恰好 删除 一 个 22 的 
概率 是 1/4, 恰好 删除 一 个 23 的 概率 是 1/8, 依 此 类 推 . 

我 们 用 它 来 建立 一 个 确定 性 系统 . 这 里 有 一 个 确定 性 映射 , 它 定义 在 全 体 奇 数 
上 , 即 了 (2m+1) = (6m 二 4)/2™6m+), 其 中 m(6m 二 4) 指 的 是 从 6m+4 二 3(2m+1) 二 1 
中 能 删除 的 2 的 方 圭 数 . 考虑 下 面 这 个 相关 过 程 : 把 输入 x 发 送 给 3z/2 的 概率 是 
1/2, 发 送 给 3z/4 的 概率 是 1/4, 发 送 给 3z/8 的 概率 是 1/8, 等 等 . 注意 , 这 与 确定 
性 映射 非常 相似 , 但 有 两 点 不 同 . 第 一 点 是 这 个 过 程 与 概率 有 关 . 第 二 点 是 这 里 
去 掉 了 人 中 的 +1; 对 于 较 大 的 输入 , 我 们 希望 这 点 差别 可 以 忽略 不 计 ( 当 vw 的 大 
小 是 10100 时 , 有 没有 +1 不 会 对 上 述 概率 过 程 造 成 任何 影响 ; 但 是 , 在 确定 性 过 程 
中 , 这 会 使 得 被 删除 的 2 的 方 甘 数 产生 很 大 变化 ). 虽然 这 个 过 程 是 随机 的 , 却 很 好 
地 描述 并 预测 了 确定 性 系统 的 属性 , 而 且 强 调 了 随机 变量 的 强大 作用 . 关于 这 个 有 
趣 问 题 的 更 多 信息 , 请 参阅 调查 文献 [Lagl, Lag2] 以 及 研究 丛书 [Lag3]. 

在 本 章 的 最 后 , 我 们 回顾 一 下 前 面 分 析 过 的 一 些 例子 . 为 什么 在 某 些 例子 中 我 
们 可 以 得 到 很 好 的 解析 表达 式 , 在 其 他 例子 中 却 得 不 到 ? 这 是 因为 在 某 些 例子 中 ， 
我 们 可 以 使 用 几何 级 数 公 式 ; 但 在 另 一 些 例子 中 , 我 们 使 用 的 是 整数 和 公式 . 在 两 
个 “成 功 ” 的 例子 中 , 我 们 得 到 了 漂亮 的 CDF 解析 表达 式 , 这 是 因为 我 们 有 很 好 的 
求 和 结果 . 遗憾 的 是 , 大 部 分 和 都 没有 漂亮 的 解析 表达 式 . 之 前 研究 的 问题 并 不 是 
巧合 , 几何 级 数 公 式 与 整数 和 公式 是 最 著名 的 两 个 求 和 公式 . 一 般 情况 下 , 离散 型 
随机 变量 的 累积 分 布 函数 不 能 简化 为 一 个 漂亮 的 解析 表达 式 . 但 连续 型 随机 变量 
的 情况 就 完全 不 同 了 . 有 什么 不 同 呢 ? 在 连续 型 随机 变量 中 , 我 们 要 算 的 是 积分 而 
不 是 求 和 . 利用 微 积 分 基本 定理 , 我 们 可 以 得 到 漂亮 的 闭 型 解 . 
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7.5 习 题 


习题 7.5.1 ”描述 离散 型 随机 变量 的 三 个 实际 应 用 . 不 要 使 用 本 章 已 经 给 出 的 例子 . 
习题 7.5.2 ”交错 调和 级 数 如 下 所 示 


Co nl 
Be eh a 
nN 


wos 


它 的 和 是 log(2). 


Pr(X=n) = 


是 概率 密度 函数 吗 ? 请 给 出 解释 


习题 7.5.3 ”给 定 正 整数 和 n, 其 中 有 <n. 证明: 对 于 任意 的 km<n,Pr(M = m)= 


(2-)/() 是 概率 密度 函数 . 


习题 7.5.4 ” 当 C 取 何 值 时 , 对 于 所 有 的 非 负 整数 n, Pr(X = n) = C/nl! 都 是 概率 密度 函 


数 ? 


习题 7.5.5 ”独立 地 抛 撕 两 颗 均 匀 的 骨 子 , 并 考察 掷 出 的 数字 之 和 , 我 们 看 到 , 两 个 相同 的 随 
机 变量 之 和 会 趋向 于 它们 的 中 间 值 . 更 确切 地 说 , 如 果 结 果 空 间 中 的 元 素 可 以 构成 一 个 等 
差 数 列 , 那么 两 个 独立 同 分 布 的 随机 变量 之 和 就 接近 于 该 数列 平均 值 的 2 倍 . 这 是 为 什 


么 呢 ? 


习题 7.5.6 ”如 果 X 是 在 fm 人 十 1 ,n} 中 均匀 取 值 的 离散 型 随机 变量 , 那么 和 一 X 是 


什么 情况 ? 为 什么 ? 


习题 7.5.7 ”抛掷 一 颗 6 面 般 子 ; 在 掷 出 数字 6 之 前 , 抛掷 的 总 次 数 服从 什么 样 的 概率 分 布 ? 


习题 7.5.8 ” 设 f(n) = 工 其 中 me {1,2,3,…}; 了 是 概率 质量 函数 吗 ? 为 什么 ? 如 果 不 
是 概率 质量 函数 , 那么 是 否 存在 1 个 常数 C, 使 得 g(n) = Cf(n) 是 概率 质量 函数 ? 
习题 7.5.9” 设 f(n) = 0 二 ,其 中 n€ {1,2,3,…}; 了 是 概率 质量 函数 吗 ? 为 什么 
f 不 是 概率 质量 函数 , 那么 是 否 存在 一 个 常数 C, 使 得 g(n) = Cf(n) 是 概率 质量 
其 中 ne€ {1,2,3,…}; 了 是 一 个 概率 质量 函数 吗 ? 为 


习题 7.5.10” 设 f(n) = zorpijeray; 
什么 ? 如 果 f 不 是 概率 质量 函数 , 那么 是 否 存 在 一 个 常数 C, 使 得 g(n) = Cf(n 
质量 函数 ? 


? 如 果 


函数 ? 


是 概率 


习题 7.5.11 ”假设 有 4 颗 独立 的 人 般 子 , 前 2 颗 散 子 都 等 可 能 地 毛 出 {1,2,3,4,5,6} 中 的 任何 
一 个 数 , 而 后 2 颗 角 子 都 等 可 能 地 撕 出 {100, 200, 300, 400, 500, 600} 中 的 任何 一 个 数 . 4 


颗 山 子 掷 出 的 数 之 和 服从 什么 样 的 概率 分 布 ? 


习题 7.5.12 ”假设 抛掷 一 枚 便 币 出 现 正面 的 概率 是 p, 那么 首次 撕 出 正面 时 , 抛掷 便 币 的 总 


次 数 服从 什么 样 的 概率 分 布 ? 验证 这 是 一 个 概率 分 布 . 


习题 7.5.13 ”考虑 一 枚 人 硬币 , 它 掷 出 正面 的 概率 是 p，Xs 表示 第 2 次 括 出 正面 时 抛掷 硬币 
的 总 次 数 , 计算 Xs 的 概率 密度 函数 . 当 第 次 掷 出 正面 时 , 抛掷 便 币 的 总 次 数 服从 什么 


样 的 概率 密度 函数 ? 当 连 续 掷 出 2 个 正面 时 , 情况 又 是 什么 样 的 ? 


习题 7.5.14 


己 经 重新 抛 据 了 第 1 次 掷 出 正面 的 所 有 硬币 ), 正面 的 个 数 服从 什么 样 的 概率 密度 函数 ? 


习题 7.5.15 


抛掷 n 枚 均匀 的 硬币 . 掷 出 正面 的 硬币 会 重新 抛 一 次 . 在 完成 重新 抛 扼 后 ( 即 


二 


抛 撕 一 枚 均匀 的 硬币 8 次 , 恰好 掷 出 5 次 正面 的 概率 是 多 少 ? 在 8 次 抛 撕 中 ， 


最 多 掷 出 5 次 正面 的 概率 是 多 少 ? 


习题 7.5.16 


是 个 概率 分 布 . (提示 : 利用 二 项 式 定 理 .) 


习题 7.5.17 


证 明 : 对 于 任意 的 0< p< 1， 


(Prop 若 kk€ {0,1,.… ,n} 
Prob(X = k) = 
0 其 他 


考虑 随机 变量 X 和 YY, 其 中 X 是 抛掷 一 颗 均 匀 的 骨 子 3 次 所 得 到 的 最 大 数 


字 , 是 抛掷 一 颗 均 匀 骨 子 1 次 得 到 的 数字 . 计算 P(X > YY). 


习题 7.5.18 


设 X 是 一 个 离散 型 随机 变量 . Pr(X 十 X = 2z) > Pr(X =x)+Pr(X = x) 


定 成 立 吗 ? 证 明 或 反 驱 . 


习题 7.5.19 


独立 地 抛 撕 10 枚 均匀 的 硬币 , 并 把 掷 出 正面 的 硬币 重新 抛 一 次 . 正面 出 现 的 


总 次 数 服 从 什么 样 的 概率 分 布 ? 


习题 7.5.20 


可 . 
面 时 , 你 的 赌资 会 翻 倍 ; 每 当 掷 出 反面 时 , 你 会 输 掉 一 半 的 赌资 . 计算 一 下 , 在 抛 奖 了 5 次 


你 有 10 美元 可 以 投注 如 下 赌局 . 你 要 抛掷 一 枚 均匀 的 硬币 5 次 . 每 当 掷 出 正 


之 后 , 你 拥有 的 钱 的 概率 密度 函数 . 假设 你 赢 的 每 1 美元 与 你 得 掉 的 每 1 美元 具有 同等 


的 价值 ， 


吗 ? 
习题 7.5.21 


人 演 


这 是 场 有 利 的 赌局 吗 ? 如 果 你 有 32 美元 , 而 不 是 10 美元 , 那么 情况 会 有 所 不 同 


考虑 以 下 两 项 投资 . 你 可 以 购买 股票 4, 它 每 年 增值 到 1.1 倍 的 概率 是 1/2, 价 


值 保持 不 变 的 概率 是 1/2. 另外 , 你 也 可 以 购买 债券 B, 它 能 保证 每 年 的 价值 增加 到 1.05 
倍 . 假设 你 只 能 购买 其 中 一 项 投资 产品 , 而 且 将 在 5 年 内 持 有 该 项 投资 , 那么 哪 项 投资 会 


习题 7.5.22 


增值 到 1.1 倍 的 概率 是 1/3, 增值 到 1.2 的 概率 是 1/3; 你 也 可 以 购买 债券 B, 它 能 保证 


带 来 更 好 的 预期 收益 . 


以 上 一 题 为 基础 . 现在 你 可 以 购买 股票 A, 它 每 年 保持 价值 不 变 的 概率 是 1/3， 


每 年 的 价值 增加 到 1.1 借 , 简要 说 明 一 下 , 你 会 选择 哪 项 投资 ? 


下 面 这 个 练习 与 受 欢迎 的 棋盘 游戏 Risk 有 直接 关联 . 我 们 不 详细 讨论 游戏 规 


关注 与 概率 有 关 的 方面 . 考虑 抛 括 5 颗 均匀 骨 子 的 结果 , 即 a1、a2、as、b1 和 bo; 它 


们 是 相互 独立 的 随机 变量 , 并 且 都 在 {1, 2, 3, 4,5,6} 中 均匀 取 值 . 计算 “max(ai, a2, a3 


max(b1, 


> 
bz) 并 且 {a1, az,as} 中 第 二 大 的 值 大 于 min(b1, 02) (也 就 是 说 , a; 中 的 最 大 值 大 


LI 


于 b; 中 的 最 大 值 , 并 且 a; 和 b; 的 第 2 大 元 素 也 有 相同 的 大 小 关系 )” 的 概率 . 


习题 7.5.24 


与 上 一 题 的 符号 相同 . 计算 “max( ,pz) > max(ai1, a2,a3) 且 min(b1,b2) 大 于 


{a1, Q2) a3} 中 第 二 大 的 值 4 的 概率 . 


习题 7.5.25 


考虑 随机 变量 X, 它 等 于 某 给 定 页 面 中 出 现 拼写 错误 的 个 数 . 描述 X 的 pdf 


应 该 具有 的 性 质 ， 有 一 点 要 考虑 , 那 就 是 每 个 拼写 错误 是 否 与 其 他 拼写 错误 是 相互 独立 


的 . 证 明 你 给 出 的 模型 


[2 


习题 7.5.26 


色 


习题 7.5.27 
留 时 间 ; 也 


班 , 这 将 毁 掉 你 整个 


的 时 间 ， 
了 , 它 对 


后 乡 


袋子 里 
子 中 取出 3 个 筹码 . 
假设 


比如 30 分 钟 , 而 且 


有 4 个 红色 的 筹码 , 3 个 


| 渡 表示 取 到 红 


色 的 筹码 和 5 个 黑色 
色 筹 码 的 个 数 . 求 出 X 
尔 正在 旅行 , 要 赶 5 个 航班 . 不 幸 的 是 , 你 没有 做 好 计划 , 中 途 没 有 安排 停 


i 


就 是 说 , 如 果 有 一 个 航班 延误 了 ， 


J 下 一 个 航班 又 准时 


k 行 计划 . 给 出 一 个 不 


=-D LDLH 


合理 的 假设 , 即 所 有 迟到 的 航 志 


航班 延误 是 相互 独立 的 . 也 就 是 说 ， 


如 果 你 的 


色 的 筹码 . 你 随意 地 从 袋 
的 pdf. 


起 飞 , 那 你 就 会 错过 航 
下 都 延误 了 相同 


第 一 个 航班 延误 


宇航 班 延误 的 可 能 性 没有 任何 影 


是 25%. 在 这 5 个 航班 中 ， 
习题 7.5.28 ”布尔 


坏 球 - 


上 侄 , 这 是 另 一 个 新 的 
失败 了 3 次 , 那么 他 就 要 出 
可 以 上 铭 . 假设 有 一 个 投手 的 球 是 不 可 
半 的 击 球 手 上 名, 并 让 另 一 半 


尔 没 有 错过 人 有 
达 累 姆 曾 说 过 :“18 次 三 击 未 


F 何 一 个 航 志 


能 被 打 


外. 另外 


个 更 合理 


的 假设 是 


f 的 概率 是 多 少 ? 


飞机 延误 的 概率 
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中 出 


局 , 这 是 一 


是 多 少 ? 


个 间 
医 赛 纪录 . ”在 棒球 比赛 中 , 如 果 击 球 了 
局 ; 如 果 在 第 3 个 好 球 之 前 已 经 有 4 个 坏 球 , 那么 击 球 手 就 
的 , 但 更 疯狂 的 是 , 人 从 
击 球 手 出 局 . 要 想 实 现 这 一 点 , 该 投手 


的 联赛 纪录 ; 18 次 四 
FF 在 第 4 个 球 之 前 已 经 


] 认 为 他 可 以 让 一 
役 出 好 球 的 概率 必须 


习题 7.5.29 ”假设 一 个 击 球 手 每 次 上 场 击 球 都 有 如 下 几 种 可 能 情况 : 本 鸡 打 、 三 倒 打 、 二 全 
打 、 一 人 垒 打 、 腾 空 球 出 局 、 四 坏 球 上 人 垒 、 地 滚 球 出 局 、 以 及 三 击 未 中 出 局 . 除了 最 后 一 种 
情况 外 , 假设 每 种 情况 发 生 的 概率 都 是 1/10, 而 三 击 未 中 出 局 发 生 的 概率 是 3/10. 如 果 
这 个 击 球 手 每 场 比赛 都 有 4 次 上 场 机 会 , 那么 下 列 事件 发 生 的 概率 是 多 少 . 

1) 戴 着 金色 阔 边 帽 (三 击 未 中 出 局 发 生 了 4 次 )? 

2) 完全 打击 (按照 任意 次 序 打 出 本 人 又 打 、 三 垒 打 、 二 人 垒 打 和 一 人 又 打 )? 
3) 至 少 打出 2 个 本 人 垒 打 ? 

4) 每 次 都 上 从? 

5) 至 少 上 全 2 次 ? 

6) 最 多 上 人 垒 2 次 ? 

7) 安打 率 大 于 或 等 于 0.500 (安打 数 大 于 或 等 于 出 局 数 )? 

习题 7.5.30 ” 设 X 是 一 个 随机 变量 , 它 的 取 值 是 抛掷 一 枚 均匀 硬币 3 次 后 出 现 正面 的 次 数 . 
画 一 个 柱状 图 来 说 明 X = n 的 概率 . 当 把 这 枚 硬币 抛掷 6 次 、10 次 、20 次 和 40 次 后 ， 
重新 考虑 这 个 问题 

习题 7.5.31 重新 考虑 上 一 个 练习 ， 但 现在 不 考察 正面 出 现 的 次 数 , 而 是 绘制 正面 次 数 减 去 
反面 次 数 的 柱状 图 . 

习题 7.5.32 “” 抛 搓 一 枚 均匀 的 硬币 3 次 , 求 出 正面 次 数 的 概率 密度 函数 . 当 把 这 枚 硬币 抛掷 
6 次 、10 次 、20 次 和 40 次 后 , 重新 考虑 这 个 问题 . 

习题 7.5.33 ” 抛 括 一 枚 均匀 的 硬币 3 次 , 求 出 正面 次 数 减 去 反面 次 数 的 累积 密度 函数 . 当 把 


这 枚 硬币 抛 


掷 6 次 、10 次 、20 次 和 40 次 后 , 导 


下 新 考虑 这 个 问题 . 
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章 ”连续 型 随机 变量 


我 不 认同 数学 , 0 的 总 和 是 个 可 怕 的 数字 . 
一 一 斯 坦 尼 斯 耶 ,《 更 凌乱 的 思绪 》(1968) 


不 要 尺 讶 , 连续 型 随机 变量 和 离散 型 随机 变量 到 
有 一 个 非常 重要 的 不 同 点 . 它们 的 不 同 之 处 在 于 , 连续 型 随机 变量 要 计算 积分 , 而 
离散 型 随机 变量 要 求 和 . 这 种 差别 有 什么 深远 意义 呢 


分 基本 定理 . 我 们 会 快速 地 回顾 一 下 这 个 定理 ; 简单 地 说 , 可 以 利用 


线 下 方 的 面积 . 对 于 很 多 函数 来 说 , 计算 这 些 积分 没有 太 大 的 困难 ; 
们 也 能 得 到 精确 的 答案 . 但 遗憾 的 是 , 并 没有 相应 的 求 和 理论 . 一 


LE 论 之 间 有 很 多 相似 之 处 , 但 也 


? 学 过 微 积 分 的 人 都 知道 微 积 


积分 来 计算 
在 求 概率 时 , 我 
股 情况 下 , 想 要 得 
到 漂亮 且 简 单 的 求 和 解析 表达 式 会 更 加 困难 (就 像 我 们 在 7.3 节 中 看 到 的 那样 ; 当 
然 , 在 讨论 很 多 离散 分 布 时 能 够 求 和 ). 这 就 是 连续 型 随机 变量 通常 更 容易 处 理 的 原 
因 ; 我 们 更 希望 从 解析 表达 式 中 看 出 , 当 参 数 改 变 时 , 答案 是 如 何 变化 的 . 

后 面 儿童 会 讨论 很 多 常见 的 连续 型 随机 变 
容 做 好 准备 . 我 们 将 描述 它 人 


k 


时, 而 本 章 的 目的 就 是 为 引入 这 些 内 
] 的 一 些 用 途 及 特性 . 为 了 保持 这 些 章节 的 独立 性 , 我 


们 会 像 介绍 离散 型 随机 变量 那样 , 对 同一 个 论点 进行 多 次 重复 . 多 看 看 这 些 论点 没 


什么 坏处 . 大 体 框架 没有 发 4 


E 变 化 , 唯一 的 区 别 是 这 


里 要 计算 积分 , 而 不 是 求 和 . 


但 是 , 在 给 出 这 些 连续 概率 分 布 之 前 , 我 们 先 快速 地 回顾 一 下 微 积分 以 及 本 


章 会 用 到 的 其 他 一 些 结果 . 毫 无 疑问 ， 几 乎 在 所 有 日 
痛苦 的 都 是 那些 默认 已 经 学 过 的 知识 ， 对 概率 论 课 
候 这 距离 学 生 学 完 导 数 和 积分 已 经 过 去 一 年 (甚至 很 多 年 ! ) 了 .幸运 的 是 , 一 
这 一 点 ， 如 果 你 想 更 详细 地 回顾 这 些 概 念 , 我 建议 你 


节 简 短 的 复习 课 就 足以 弥补 
读 一 下 阿 德里 安 ” 班 纳 的 《 


的 数学 课 上 ， 让 学 生 
来 说 , 这 特别 危险 ， 


门 感到 最 
因为 有 时 


普林斯顿 微 积分 读本 》, 这 本 书 的 所 有 内 容 都 讲 得 非 


找到 . 
本 章 的 安排 如 下 : 
(1) 复习 微 积分 基本 定理 


及 其 在 概率 论 上 的 应 用 


(2) 在 计算 连续 型 随机 变量 的 单元 素 事 件 的 概 : 


讨论 . 


时， 对 可 能 出 现 的 


常 仔细 .为 了 检验 你 对 微分 和 积分 技巧 的 掌握 程度 , 我 给 出 了 50 多 个 微 积分 问 
题 及 其 解答 ， 这 部 分 内 容 ( 先 陈述 题目 , 然后 给 出 详 旨 
充 材 料 (比如 ,回顾 变量 替换 定理 和 一 些微 积 


的 解 题 方案 ) 以 及 其 他 补 
分 复习 课 ) 可 以 从 在 线 补充 资料 中 


问题 展 


8.1 微 积 分 基本 定理 247 


微 积分 基本 定理 是 研究 连续 型 随机 变量 最 重要 的 工具 之 一 . 事实 上 , 这 就 是 我 
们 可 以 不 断 得 到 如 此 漂亮 的 解析 表达 式 的 原因 . 我 们 将 快速 地 回顾 其 表达 式 中 不 同 
项 所 代表 的 含义 , 然后 告诉 你 这 个 定理 为 何如 此 重要 . 遗憾 的 是 , 大 部 分 微 积分 教 
师 并 不 会 强调 积分 和 概率 之 间 的 关联 . 正 因 如 此 , 当 学 生 们 在 微 积分 中 看 到 这 些 论 
述 时 , 往往 没什么 印象 , 也 不 会 有 学 习 的 积极 性 . 我 们 将 很 快 看 到 , 利用 微 积分 基本 
定理 , 我 们 可 以 求 出 曲线 下 方 的 面积 , 而 这 些 面积 恰好 对 应 于 某 些 事件 的 概率 ! 

我 们 快速 复习 一 下 微 积分 中 的 一 些 术语 . 设 f 是 一 个 函数 ; 如 果 另 一 个 函数 环 
满足 严 (z) = f(x), 那么 就 被 称 作 f 的 一 个 原 函 数 , 或 者 f 的 一 个 (不 定 ) 积分 . 
注意 , 原 函 数 是 不 唯一 的 : 如 果 下 (xz) = f(x), 并 且 G(xz) = (x) 十 C0, 其 中 C 是 某 
个 固定 常数 , 那么 G'(z) = f(z); 这 就 是 说 “一 个 ” 原 函 数 的 原因 . 事实 上 , 这 是 唯 
一 可 能 出 错 的 地 方 . 具体 地 说 , 如 果 F 和 G 都 是 f 的 原 函 数 , 那么 它们 一 定 相差 

每 当 看 到 函数 和 陈述 时 , 就 试 着 赋值 并 编造 一 个 故事 . 例如 , 用 f(x) 表示 我 们 
在 时 刻 z 的 移动 速度 , 用 F(x) 表示 我 们 在 时 刻 x 的 位 置 . 请 注意 , 这 是 个 合理 的 
故事 , 我 们 所 处 位 置 的 变化 速率 就 是 我 们 的 速度 . 现在 就 可 以 解释 上 面 有 关 原 函数 
的 论述 了 . 假设 我 们 有 两 个 朋友 Floyd 和 Grover, F(z) 和 G(z) 分 别 表示 他 们 在 时 
刻 z 的 位 置 . 现在 假设 他 们 的 速度 是 一 样 的 ; 那么 F(x) = G'(z). 如 果 他 们 总 是 以 
相同 的 速度 移动 , 那么 两 人 之 间 的 距离 一 定 保持 不 变 , 因此 肯定 存在 一 个 C, 使 得 
G(x) = F(x) 十 OC. (我 们 选择 Floyd 和 Grover 这 两 个 有 些 不 寻常 的 名 字 是 为 了 把 
函数 与 人 物 对 应 起 来 , 希望 能 让 你 更 容易 地 看 出 它们 之 间 的 关联 . 我 总 是 建议 大 家 
花 点 时 间 想 出 恰当 的 符号 .) 

我 们 需要 的 下 一 个 概念 是 分 段 连续 函数 ; 除了 有 限 多 个 点 之 外 , 函数 在 其 他 点 
处 都 是 连续 的 . 例如 , 考虑 图 8-1 中 定义 在 区 间 [0,4 上 的 函数 . 除了 在 x = 1,2,3 
这 三 个 点 处 不 连续 之 外 , 函数 在 其 他 地 方 都 是 连续 的 . 所 以 , 这 就 是 一 个 分 段 连续 

注意 , 这 个 定义 要 求 具 存在 有 限 多 个 不 连续 的 点 . 如 果 有 无 穷 多 个 不 连续 的 点 ， 
我 们 可 能 就 无 法 使 用 微分 和 积分 这 些 标准 工具 了 . 如 果 你 学 过 实 分 析 , 那么 这 里 的 
很 多 假设 都 能 被 削弱 , 因为 标准 积分 (也 被 称 为 黎 曼 积 分 ) 会 被 更 强大 的 勒 贝 格 积 
分 取代 . 

接 下 来 还 有 一 个 定义 . 曲线 y= f(z) 与 x 轴 之 间 . 从 xz =a 到 z=5。 所 围 成 区 
域 的 面积 记 作 及 f(z)dx; 这 就 是 定 积分 . 它 是 一 个 有 符号 的 量 ; 对 于 为 什么 面积 是 
负 的 , 学 生 们 经 常 感到 困惑 . 这 是 因为 我 们 把 x 轴 上 方 和 曲线 下 方 的 面积 看 作 正 的 ， 


把 z 轴 下 方 和 曲线 上 方 的 面积 看 作 负 的 . 例如 , 考察 图 8-2 中 的 f(z) = (z 二 1)2 sinx. 
曲线 下 方 直 到 x = x 的 面积 是 正 的 , 但 曲线 上 方 从 x 到 2x 的 面积 是 负 的 . 


12 上 
10 上 0 
s| 
ot 
4 2 
2 上 一 
1 2 3 4 


图 8-1 f(z) = zlz| 的 图 形 , 其 中 | 是 一 个 地 板 函 数 , 它 将 返回 不 超过 t 的 最 大 整数 


当 0<z<2r 时 , f(x) = (zx 十 1)?sinz 下 方 的 面积 . z 轴 上 方 的 面积 是 正 的 , xz 轴 
下 方 的 面积 是 负 的 


你 可 以 把 x 轴 上 方 的 面积 看 作 你 拥有 的 钱 (资产 ) 并 把 > 轴 下 方 的 面积 看 作 
你 欠 的 钱 (负债 ). 这 里 的 负 号 相当 重要 一 一 你 的 净 资 产 是 你 拥有 的 钱 与 所 欠 钱 的 
差额 . 我 们 不 能 只 把 两 个 数 相 加 , 必须 要 把 符号 包括 在 内 . 

如 果 对 本 章 内 容 有 所 了 解 , 你 可 能 会 认为 , 人 们 在 学 习 微 积 分 时 需要 担心 此 类 
问题 , 但 学 习 概 率 论 就 不 会 有 这 方面 的 顾虑 , 因为 所 有 概率 密度 都 是 非 负 的 . 因此 ， 
如 果 要 算 的 是 曲线 下 方 的 面积 , 那么 就 没 必 要 担心 这 个 问题 了 ! 不 笠 的 是 , 概率 密 
度 不 是 唯一 需要 计算 积分 的 函数 . 当 计 算 平 均 数 (随机 变量 的 平均 值 ) 时 , 我 们 会 
遇 到 可 以 取 负 值 的 函数 , 因此 这 些 问 题 很 重要 . 


了 的, 现在 已 经 有 了 充分 的 准备 . 我 们 可 以 陈述 微 积分 基本 定理 了 . 


Po 
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微 积分 基本 定理 : 设 f 是 一 个 分 段 连 续 函 数 , FF 是 f 的 任意 一 个 原 函 数 . 那么 
b 
人 f(z)dz = F(b)— F(a). 


文字 叙述 : 在 曲线 y = f(z) 下方 、 介 于 z=a 和 =。 之 间 的 (有 符号 的 ) 面积 
就 等 于 , f 的 原 函 数 在 5 处 的 值 减 去 f 的 原 函 数 在 a 处 的 值 . 


微 积分 基本 定理 所 表述 的 内 容 很 容易 被 误解 . 很 多 人 错误 地 认为 符号 户 f(z)dz 
意味 着 F(b) 一 (a), 然而 事实 并 非 如 此 ! 这 个 符号 表示 曲线 y = f(x) 下 方 介 于 x = a 
和 z=5 之 间 的 面积 . 这 是 一 个 很 深奥 的 定理 , 把 两 点 处 的 原 函 数值 相 减 就 得 到 了 
上 述 面积 . 

在 下 一 节 中 , 我 们 将 看 到 它 是 如 何在 概率 论 中 发 挥 作用 的 . 


8.2 ”概率 密度 函 效 和 累积 分 布 函 数 : 定义 


我 们 希望 以 离散 型 随机 变量 为 基础 来 建立 一 个 关于 连续 型 随机 变量 的 相似 理 
论 . 在 考虑 如 何 从 离散 型 随机 变量 的 定义 过 渡 到 连续 型 随机 变量 的 定义 之 前 , 我 们 
先 回顾 一 些 问 题 以 及 连续 型 随机 变量 的 复杂 性 . 遗憾 的 是 , 我 们 无 法 彻底 解决 这 些 
问题 ; 要 想 实现 这 一 点 , 要 用 到 高 等 分 析 理 论 , 但 这 远 远 超出 了 本 书 的 范围 和 目标 . 
幸运 的 是 , 我 们 没 必 要 这 样 做 . 还 有 大 量 不 需要 使 用 这 些 高 等 技巧 的 问题 ; 毫 无 疑 
问 , 这 才 是 我 们 要 研究 的 对 象 . 因此 , 在 接 下 来 的 几 段 中 , 当 你 读 到 与 连续 型 随机 变 
量 的 定义 有 关 的 内 容 时 , 请 记 住 为 什么 要 读 它 们 ! 主要 是 提醒 你 留意 前 方 的 危险 ， 
并 且 必 须要 小 心 谨慎 . 
我 们 的 目标 是 在 结果 空间 中 定义 一 个 连续 型 随机 变量 . 实际 上 , 这 比 结果 空间 
是 有 限 的 或 可 数 的 情况 要 更 困难 一 些 . 记 住 , 一 个 概率 空间 由 3 部 分 组 成 : 结果 空 
间 Q, 概率 函数 Prob, 以 及 Prob 有 定义 的 子 集 构成 的 o 代数 (Prob 在 其 他 子 集 上 
无 定义 ). 这 意味 着 我 们 无 法 对 Q 的 任意 子 集 求 概率 , 只 能 求 出 某 些 特定 子 集 的 概 
率 , 这 就 导致 了 一 些 困 难 . 

这 样 的 限制 是 很 有 必要 的 . 一 个 典型 的 例子 是 , 从 [0,H 中 随机 地 选 出 一 个 数 ， 
并 且 每 个 数 都 等 可 能 地 被 选中 . 当 试 着 去 这 样 做 时 , 我 们 会 遇 到 麻烦 . 这 里 只 有 两 
种 可 能 : 概率 是 正 数 , 或 者 概率 是 0. 如 果 概 率 是 正 数 , 那么 因为 [0,1] 中 有 无 穷 多 
个 点 , 所 以 概率 和 会 大 于 1, 这 是 不 可 能 发 生 的 . 如 果 选 出 任何 一 个 数 的 概率 均 为 
0, 那么 情况 又 如 何 ? 这 意味 着 什么 都 没有 发 生 , 因为 0 的 和 仍然 是 0. 这 种 做 法 是 
不 正确 的 , 因为 现在 有 不 可 数 个 数 求 和 , 而 加 法 规则 (对 于 互 不 相交 的 集合 , 它们 的 
并 的 概率 就 等 于 它们 各 自 的 概率 之 和 ) 只 适用 于 可 数 的 并 . 另外 , 我 们 讨论 的 是 从 
一 个 区 间 中 选 出 一 个 数 的 概率 . 在 这 种 情况 下 , 我 们 希望 长 度 相同 的 区 间 具 有 相等 


[I 
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的 概率 . 唯一 自然 的 选择 是 , 从 [ww 中 c [0,1 中 选 出 一 个 数 的 概率 是 b 一 a. 
这 与 连续 型 随机 变量 有 什么 关系 呢 ? 回忆 一 下 , 在 定义 了 离散 型 随机 变量 之 后 ， 


我 们 又 给 出 了 概率 密度 函数 和 累积 分 布 函数 
Prob(X < x). 在 连续 型 随机 变量 的 情况 下 , 为 了 确保 这 两 个 概率 也 
面 两 个 集合 都 必须 属于 o 代数 中 : {we 0Q: X(w)= zx} 和 {weQ0: X(w) 
或 至 多 为 z 的 元 素 都 一 定 在 o 
考察 要 研究 的 概率 空间 . 在 


换 句 话说 , 在 X 的 作 
因此 , 我 们 必须 
论 连 续 型 随机 变量 的 


Tl 


日 下 , 所 有 函数 值 为 x 


的 定义 . 我 们 想 求 出 


FE 常 仔细 地 


则 型 例题 . 结果 空 


它 的 “ 漂 


或 实 直线 及 = 
有 一 个 定义 在 o 代数 上 
埋 果 空间 是 [0,co), 那么 它 也 可 以 扩展 成 (一 oo 


ud 


2 


为 0 就 行 了 . 这 样 做 的 好 处 是 ， 定义 在 实数 子 集 上 的 所 有 随机 变 直 


号 来 表示 . 


亮 ” 子 集 、R3 的 漂亮 子 集 , 等 等 . 
子 . 幸运 的 是 , 关于 这 些 漂亮 区 域 的 好 例子 
(一 00, co) 有 关 . 但 


i 


要 记 住 , 概率 空 | 


玄 去 想象 一 个 


上 Prob(X 
能 计算 出 来 ,下 


E 本 书 中 , 我 们 将 继 缚 
x 间 会 是 一 个 区 间 : 实数 集 及 、 平 面 及 2 以 及 
区 间 : 圆 形 、 和 矩形 或 盒 
FE 常 多 . 最 重要 的 例子 与 半 直 线 [0, co) 
闻 不 仅仅 是 一 个 结果 空间 


= 


< 
代数 中 . 
守 讨 


( 即 定义 在 Q 的 某 些 特定 子 集 上 ) 的 概率 函数 . 因此 , 如 果 
co), 这 里 只 需要 把 负数 的 概率 指 


[=] 
作 


都 可 以 


一 个 符 


( 
(2) fx(z)>0 
(3) [® fx(t)dt=1, 


更 一 般 地 , 我 们 还 可 以 考察 定义 在 


函数 和 累积 分 布 函 


数 : 设 


X 是 一 个 


那么 X 是 一 个 连续 型 随机 变量 , fx 是 X 的 概率 密度 函 
称 为 密度 函数 . 
X 的 累积 分 布 函数 Fx(z) 就 是 X 不 大 于 z 的 概率 : 


Ex(Z) = Prob(X < 7x)= 区 fx(t)dt 


E R* 上 的 连续 型 随机 变量 . 


随机 变量 . 


有数 . 有 时 候 ， fx 也 被 误 


如 果 


这 种 


我 们 到 
乡 


忆 


维 情形 是 什么 相 


E 解 多 元 函数 可 积 的 含义 ( 换 句 话说 , 把 一 
的 ; 参见 习题 


续 且 


非 负 的 , 3 


且 其 积 4 


时 


显然 为 1. 


个 分 段 连续 
8.6.4); 幸运 的 是 , 在 很 多 


卖 的 可 积 


般 情 形 要 求 
函数 推广 到 多 


青 况 下 , 密 ) 


度 函 数 都 是 连 


你 现在 应 i 


清楚 


为 曲线 下 方 的 面积 , 而 微 积 分 (具体 地 说 , 微 积 人 让 
只, 这 样 就 能 求 出 我 们 想 要 
一 个 下 标 X 是 为 了 提醒 我 们 这 些 函 


了 我 们 为 什么 花 这 么 多 时 间 来 回 


的 概率 ! 类 似 于 在 7.3 节 
数 都 与 随机 变量 


顾 积分 . 概率 通常 可 以 表示 
告诉 我 们 如 
中 的 讨论 , 给 每 个 函数 都 加 
EX 有 关 . 当 题 


可 计算 这 些 


目 中 出 现 多 
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个 随机 变量 时 , 这 种 做 法 会 非常 有 用 ; 但 是 , 当 只 有 一 个 随机 变量 时 , 我 们 通常 不 会 
给 出 下 标 . 最 后 要 注意 , 我 们 用 小 写 f 表示 概率 密度 函数 , 并 用 大 写 已 表示 累积 4 
布 函数 . 这 种 选择 并 非 偶然 ， 其 目的 是 让 你 思考 , 在 微 积分 中 , 一 个 函数 与 它 的 原 


函数 是 如 何 相 互 作用 
我 们 简单 地 叙述 了 fx 成 为 概率 密度 函数 必须 要 满足 的 条 件 . 第 一 个 是 fx 是 


的 . 


分 段 连续 的 函数 , 这 保证 了 函数 可 以 求 积分 (基体 地 说 , 利用 微 积分 基本 定理 求 积 


分 ). 如 果 不 考 虑 分 段 


因此 , 我 们 只 需 
得 庆祝 的 , 因为 它 训 


连续 的 函数 , 我 们 也 可 以 考虑 一 个 勒 贝 格 可 积 的 函数 . 如 果 看 
不 出 这 一 点 , 你 也 不 用 担心 一 一 高 等 分 析 课 的 目的 是 
前 提 下 , 能 对 这 些 条 件 进 行 多 大 程度 的 首 
率 不 可 能 是 负 的 . 最 后 一 个 条 件 是 ， fx 有 有 
“ 茶 事 ”发 生 , 也 就 是 说 , X 取 到 了 某 个 值 ! 
要 考察 满足 这 三 个 条 件 的 函数 ; 每 发 现 一 个 这 样 的 函数 都 是 值 


想 看 看 , 在 保证 函数 可 积 的 


1 弱 ! 第 二 个 条 件 为 fx 是 非 负 的 , 因为 概 
FE 整个 空间 上 的 积分 一 定 是 1. 这 意味 着 有 


i 是 菜 个 连续 型 随机 变量 的 概率 密度 函数 . 显然 , 一 个 重要 的 问 


题 是 , 找到 这 样 的 函数 有 多 难 ? 在 下 一 节 的 开头 部 分 , 我 们 会 给 出 一 个 这 样 的 例子 . 


在 例子 结束 时 , 不 难看 出 , 我 


8.3 


概率 密度 函数 和 累积 分 


门 已 经 给 出 了 寻找 概率 密度 函数 的 一 般 原则 . 


函数 : 例子 


在 本 节 中 , 我 们 将 讨论 一 个 实用 的 经 典 问 题 . 几乎 可 以 表 定 , 没 人 会 在 意 经 典 
选择 这 个 问题 是 为 了 阐述 该 理论 的 一 些 主要 特征 . 在 后 面 的 章 


问题 中 的 随机 变量 ! 


节 中 , 我 们 会 仔细 地 研究 一 些 重要 的 随机 变量 . 


我 们 来 看 一 个 例子 . 考虑 下 面 这 个 函数 
2 十 3z 一 5z2 车 0<z<1l 
fx(7z) = | 


问题 , 我 们 必须 验 说 


的 , 且 积分 值 为 1. 


这 个 函数 显然 是 分 段 连续 的 (实际 上 , 如 果 把 空间 限制 为 z > 0, 那么 它 就 是 连 


是 否 存在 一 个 随机 变量 X, 使 得 上 述 函 数 就 是 X 的 概率 密度 函数 ? 为 了 回答 这 个 
E fx 是 否 满足 8.2 节 的 三 个 条 件 : 它 必 须 是 分 段 连 续 的 、 非 负 


续 函 数 ). 另外, 它 也 是 非 负 函数 . 想 看 出 这 一 点 , 还 要 多 做 些 工作 ; 但 我 们 可 以 采 
用 多 种 方法 来 整理 这 个 代数 表达 式 . 最 简单 的 方法 是 , 注意 到 


fx(z)=2+37— 57 一 (1 一 z)(2 十 57)， 


其 中 0 < x < 1. 在 这 个 式 子 中 , 因子 1- z 始终 是 非 负 的 , 而 2 上 +5z 也 是 非 负 的 . 
因此 , 它们 的 乘积 是 非 负 的 , 这 正 是 我 们 想 要 证 明 的 结 


果 . 另外 , 当 0< x<1 和 时， 


8 
MD 
八 
8 
ft 


24+37—57 >2+37—57=2—27z=2(1—zx)>0. 
由 此 也 能 看 出 fx(zx) 是 非 负 的 . 
接 下 来 , 只 需要 保证 它 的 积分 值 是 1. 现在 , 我 们 有 
Oo 下 
zZ)dz = 2 十 37 一 572 
户 ro 人 erm- 


1 3z211 5z3 


1 


a 0 3 lo 
5 11 
2 3 6- 


一 切 看 起 来 好 像 都 如 我 们 所 希望 的 那样 , 但 遗憾 的 是 , 这 并 不 是 概率 分 布 函数 .只 
满足 三 个 条 件 中 的 两 个 是 不 够 的 一 一 这 三 个 条 件 必须 同时 满足 ! 
如 果 这 三 个 条 件 中 必 有 一 个 无 法 满足 , 那么 我 们 希望 它 是 第 三 个 条 件 . 为 什么 
呢 ? 因为 第 三 点 是 最 容易 补救 的 . 改变 函数 的 一 般 形 态 十 分 困难 , 但 是 可 以 利用 一 
个 常数 来 对 它 进行 缩放 , 从 而 使 其 积分 值 为 1. 考虑 函数 

6 
9x(7) 三 五 六 (四 
这 两 个 函数 没有 太 大 区 别 . 由 于 fx 是 个 分 段 连续 的 函数 , 因此 gx 也 是 如 此 . 同 
样 , 由 fx 是 非 负 的 可 知 , gx 也 是 非 负 的 . 那么 , 第 三 个 条 件 呢 ? 由 微 积 分 知识 可 
得 , 常数 可 以 从 积分 中 提取 出 来 . gx 的 积分 就 是 fx 积分 的 6/11. 由 于 fx 的 积 4 
值 是 11/6, 因此 gx 的 积分 值 就 是 和 . 是 = 1, 那么 gx 就 是 个 概率 密度 函数 ! 另 
外 , 我 们 也 可 以 通过 直接 求 积 分 来 得 到 这 一 点 : 


ooe 1 
gx(t)dt | 和 +3t— 5t2) dt 
Ee o 11 


6 广 
二 一 2+3t—5t)d 
i (2+3t— 5t°) dt 
6 [1 3 5t3]1 
| 
| 210 300 
6 3 5 
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11 13 | 
ek 
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这 个 积分 类 似 于 上 一 个 积分 并 不 奇怪 , 因为 唯一 的 变化 就 是 把 所 有 项 都 乘 上 了 6/11. 
现在 已 经 证 明了 
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是 个 概率 密度 函数 , 但 其 实 还 得 到 了 更 多 东西 . 事实 上 , 我 们 已 经 找到 了 构造 概率 
密度 函数 的 一 般 过 程 ! 


对 潜在 概率 密度 函数 的 标准 化 : 如 果 fx 是 一 个 非 负 的 分 段 连 续 函 数 , 并 且 它 的 
积分 值 是 有 限 的 , 那么 


gx(7) = Rs 
A fx(t)dt 


就 是 一 个 概率 密度 函数 . 还 可 以 这 样 表述 : 存在 一 个 。, 使 得 


gx (2) = cfx(7) 


是 一 个 概率 密度 函数 , 并 


1 
C= OT——————. 
下 fx(t)dt 


既然 我 们 知道 了 gx 是 一 个 概率 密度 函数 , 那么 它 就 可 以 用 来 计算 累积 分 布 函 
数 Gx. 我 们 有 


CGx(Z) = gx(t)dt. 


现在 有 必要 对 这 个 符号 进行 简单 的 说 明 . 为 了 求 积 分 , 我 们 需要 一 个 虚拟 变量 . 当 
计算 “随机 变量 的 取 值 至 少 为 x2” 的 概率 时 , x 不 能 当 作 积 分 中 的 虚拟 变量 . 这 就 
是 为 什么 这 里 使 用 的 是 t, 但 之 前 使 用 了 zx. 

遗憾 的 是 , 由 于 gx 是 分 段 定义 的 , 我 们 必须 要 小 心 一 点 . 幸运 的 是 , 这 三 种 情 
况 中 的 两 种 都 很 容易 处 理 . 如 果 x < 0, 那么 Gx(z) = 0. 这 是 因为 0 之 前 没有 可 
能 性 ; 也 就 是 说 , 当 t< 0 时 , gx() = 0. 对 于 xz > 1 的 情形 , 可 以 进行 类 似 的 处 理 . 
对 于 这 样 的 z, 我们 有 Gx(z) = 1. 为 什么 呢 ? 当 z > 1 时 , 函数 gx(z) = 0; 因此 ， 
当 z 继续 增加 到 大 于 1 时 , 我 们 没有 发 现 新 的 可 能 性 . 到 z = 1 为 止 , 我 们 已 经 考 
虑 了 所 有 可 能 的 情况 , 因此 对 于 任意 的 x 之 1 均 有 Gx(7x)=1. 

现在 只 需要 考虑 0 < x < 1 这 种 有 趣 的 情形 . 对 于 这 样 的 x, 我 们 有 


Gx(7) = 上 上 (2+3t— 5t°)dt 
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(2+3t— 5t°) dt 
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利用 累积 分 布 函 数 , 我 们 可 以 快速 求 出 各 种 事件 的 概率 . 例如 , 计算 X 在 (1/2， 
3/ 引 取 值 的 概率 , 其 中 X 是 一 个 随机 变量 , 它 的 概率 密度 函数 是 式 (8.1) 中 的 gx. 
在 图 8-3 中 , 我 们 绘制 了 其 概率 图 . 


0.8 1.0 
图 83 当 0<z ,+ 各 (2 二 37 一 52?); 否则 gx(z) = 0. 曲 
线 下 方 的 面积 是 1, 介 于 . 和 3/4 ra (黑色 阴影 区 域 ) 是 91/352 
答案 是 


Prob(X € (1/2,3/4]) 
3/4 
/ pe 
1/2 
= Gx(3/4) — Gx(1/2) 
6(12z 十 9z2 — 10x3) 
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352 352 352 


6(12z 十 9z2 — 1073) 
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当 计 算 X (概率 密度 函数 是 gx) 在 (1/2,3/4] 取 值 的 概率 时 , 我 们 学 到 了 非常 
重要 的 一 点 . 我 们 讨论 的 事件 是 一 个 左 开 (不 包含 1/2) 右 闭 (包含 3/4) 的 区 间 . 我 
们 计算 的 是 X 大 于 1/2 且 至 多 为 3/4 的 概率 . 在 这 里 , 对 两 个 端点 的 处 理 是 不 对 
称 的 . 但 是 , 我 们 不 需要 担心 这 一 点 , 因为 X 取 任 何 给 定 值 的 概率 均 为 0. 关于 这 
一 点 , 我 们 有 个 奇妙 的 结论 : 对 于 连续 型 随机 变量 , 单元 素 事 件 的 概率 是 0. 


8.3 ”概率 密度 函数 和 累积 分 布 函 数 : 例子 ”255 


如 果 X 是 一 个 概率 密度 函数 为 fx 的 连续 型 随机 变量 , 那么 下 面 这 四 个 概率 是 
(1) X 属于 [a,0] 的 概率 ; 
(2) X 属于 (oa 的 概率 ; 
(3) X 属于 [a,5b) 的 概率 ; 
(4) 民 于 (ww 区 的 概率 . 
原因 在 于 , 对 于 连续 型 随机 变量 X, 它 取 任何 具体 值 的 概率 都 是 0. 例如 , 由 累积 
分 布 函数 的 定义 可 得 


Fx(b) — Fx(a) + Prob(X j= /f(a 


元 素 事 件 的 概率 是 0, 所 以 上 述 表 达 式 可 以 简化 成 


-mod 


回 过 头 来 考虑 式 (8.1) 中 的 概率 密度 函数 gx, 我 们 发 现 计算 z<0 和 zz>1 时 
的 累积 分 布 函数 Gx 是 很 容易 的 . 虽然 我 们 并 没有 那么 幸运 , 每 次 都 能 得 到 漂亮 的 
CDF 解析 表达 式 , 但 我 们 确实 对 CDF 的 特性 有 一 定 的 了 解 . 具体 地 说 , 我 们 有 如 
下 结果 , 它 与 离散 型 随机 变量 的 结果 类 似 . 


因为 单 


设 X 是 一 个 连续 型 随机 变量 , 它 的 累积 分 布 函数 是 Fx. 那么 


lim Fx(x)=0 且 lim Fx(z) = 1 


另外 ,，Fx 是 一 个 单调 不 减 的 函数 : 如 果 y > x, 那么 Fx(y) > Fx(z). 


如 果 从 正确 的 角度 看 待 问题 , 这 个 结果 是 很 显然 的 . 由 于 X 是 一 个 随机 变量 ， 
因此 它 必 须 有 一 定 的 值 . 当 x 一 co X 可 以 取 任 意 值 , 那么 X < z 的 概率 就 应 
该 趋 近 于 1. 利用 概率 密度 函数 的 积分 值 为 1, 我 们 也 能 得 到 这 一 点 . 另外 , 如 果 令 
z 一 一 00, 那么 X 的 取 值 会 不 断 地 受到 限制 , 因此 X < zx 的 概率 也 会 趋 近 于 0. 

最 后 , 虽然 我 们 已 经 看 到 , 在 概率 密度 函数 fx 和 累积 分 布 函数 Fx 之 间 有 种 
很 好 的 关系 , 但 到 目前 为 止 , 我 们 只 是 从 一 个 角度 来 看 待 它 . 人 在 给 定 了 一 
个 概率 密度 函数 之 后 , 我 们 可 以 求 出 相应 的 累积 分 布 函数 . 能 不 能 从 另 一 个 角度 来 
考察 呢 ? 换 名 话说 , 我 们 能 不 能 从 Fx 中 求 出 fx? 当然 可 以 7 只 需要 使 用 积分 的 
逆 运 算 : 微分 ! 


如 果 X 是 一 个 连续 型 随机 变量 , 并 且 它 的 累积 分 布 函数 是 Fx, 那么 除了 有 限 多 
个 点 以 外 ， 对 于 任意 一 个 X 的 概率 密度 函数 fx 均 满足 FX(z) = fx(2). 


不 过 , 我 们 必须 要 小 心 . 记 住 , 概率 密度 函数 必须 是 分 段 连续 的 .虽然 累积 4 
布 函数 是 连续 的 , 但 不 一 定 是 处 处 可 微 的 ; 在 有 限 多 个 不 可 微 的 点 处 , F(z) 不 等 
于 fx(z). (因为 在 这 些 点 处 , FX (x) 根本 不 存在 ! ) 幸运 的 是 , 单元 素 事件 的 概率 是 
0, 因此 这 些 点 不 会 产生 任何 影响 . 

下 面 给 出 一 个 求 概率 密度 函数 的 例子 . 设 随 机 变量 X 的 累积 分 布 函数 是 Fx (zx). 
当 z 科 0 时 , Fx(z) 的 值 为 0; 当 z> 关 0 时 , Fx(z) 为 1-e .因为 z 和 0 时 的 概率 
密度 函数 一 定 是 0, 所 以 只 需要 考察 x > 0 时 的 情况 . 对 Fx(z) = 1 一 e-” 求 微分 ， 
可 得 


那么 概率 密度 函数 就 是 


yi 若 z>0 
Re |: 其 他 . 


8.4 ”单元 素 事件 的 概率 


节 涉 及 更 高 等 的 知识 , 你 可 以 放心 地 快速 浏览 或 者 跳 过 这 部 分 内 容 . 本 节 虽 
在 曾 述 连续 型 随机 变量 的 概率 分 配 中 可 能 出 现 的 一 些 问 题 . 
在 上 一 节 中 , 我 们 论述 了 连续 型 随机 变量 X 取 任 何 一 个 具体 值 的 概率 都 是 0. 
换 句 话说 , 单元 素 事件 的 概率 为 0, 或 者 
Prob(X = 7)=0. 


当 x 取 任 意 值 时 , 这 个 式 子 均 成 并 . 取 并 之 后 , 可 得 


Prob(X € {x1,722,..* ,Tn}) = 》 Prob(X 二 去 到 二 >》 0 = 0. 
; i=1 


上 面 的 式 子 可 以 写 得 更 紧凑 些 , 即 


Prob : € Ut) 一 


$=1 


如 果 我 们 给 出 


那么 下 面 的 式 子 是 否 成 立 
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b 
Prob(X € la,b]) = Prob : € Ue = 0? 


T=a 


这 是 很 充 诸 的 一 一 我 们 刚刚 证 明了 , 不 管 连续 型 随机 变量 X 是 什么 , 也 不 管 考 
察 的 是 哪个 区 间 , XX 取 该 区 间 中 某 个 具体 值 的 概率 都 等 于 0! 这 个 区 间 可 以 取 作 
(一 00, 00), 但 此 时 X 取 某 个 特定 值 的 概率 仍 为 0! 
上 述 内 容 好 像 在 说 什么 都 没有 发 生 . 很 明显 , 一 定 是 哪里 出 了 问题 ! 其 实 , 出 
现 这 种 状况 是 种 好 现象 一 一 结论 过 于 充 廖 , 所 以 我 们 不 得 不 做 出 修改 . 真正 危险 
的 是 , 我 们 得 到 了 一 些 貌 似 可 信 的 错误 结论 , 因为 它们 可 能 会 越过 防线 , 而 不 让 我 
门 产生 任何 怀疑 . 
不 管 怎样 , 回 到 我 们 的 问题 , 它 给 出 了 哪些 信息 ? 对 于 每 个 连续 型 随机 变量 , 它 
是 如 何 把 每 个 事件 的 概率 指定 为 0 的 ? 这 个 问题 源 于 一 个 貌似 合理 的 假设 , 但 实际 
上 是 错误 的 . 在 我 们 的 论述 中 , 最 关键 的 一 点 是 : 对 于 互 不 相交 的 事件 , 它们 的 和 
的 概率 就 等 于 它们 的 概率 之 和 . 当 考 虑 有 限 多 个 或 无 限 可 数 多 个 事件 时 , 这 个 结论 
是 正确 的 ; 但 如 果 考 虑 的 是 不 可 数 个 事件 , 那么 该 结论 就 不 一 定 成 立 了 

现在 , 一 切 又 回 到 了 本 书 的 开头 (参见 第 2 章 , 尤其 是 2.6 节 ); 我 们 非常 小 心 
地 描述 了 什么 样 的 事件 能 被 指定 概率 , 什么 样 的 事件 不 能 . 我 们 可 以 对 单元 素 事 件 
指定 概率 ; 这 没什么 问题 . 问题 在 于 , 对 于 互 不 相交 的 事件 , 我 们 不 能 断言 它们 的 不 
可 数 并 的 概率 就 是 它们 的 概率 之 和 . 
回顾 一 下 附录 C 中 的 可 数 集 和 不 可 数 集 . 在 现实 生活 中 , 我 们 见 过 很 多 有 限 
和 与 可 数 和 . 例如 , 如 果 想 计算 位 于 曲线 y = x? 下 方 , 且 介 于 0 和 1 之 间 的 nn 个 分 
区 的 面积 的 黎 曼 和 , 那么 会 得 到 


k=0 
令 n 一 oo0 (给 出 了 一 个 可 数 和 ), 我 们 就 求 出 了 这 个 面积 . 一 枚 均匀 硬币 最 终 掷 出 正 
面 的 概率 是 


之 所 以 得 到 这 个 结果 , 是 因为 “首次 掷 出 正面 发 生 在 第 ”次 抛 扼 ” 的 概率 是 1/27. 
这 要 求 前 n 一 1 次 的 抛 搓 结 果 都 必须 是 反面 (概率 为 1/2"- 9) 而 第 ”次 的 抛掷 结 
果 必 须 是 正面 (概率 为 1/3)， 
对 于 有 限 和 与 可 数 和 , 我 们 有 着 丰富 的 经 验 和 熟悉 度 . 不 可 数 和 应 该 是 什么 样 
的 呢 ? 不 妨 设 5 是 一 个 不 可 数 集 , 我 们 想 计算 
有 


ES 


为 了 便于 说 明 , 假设 oz > 0 对 所 有 的 z 均 成 立 . 想得到 有 限 和 的 方法 只 有 一 种 , 即 
除了 可 数 个 z 外 , az = 0 对 剩 下 的 所 有 z 均 成 立 . 当然 , 如 果真 是 这 样 的 话 , 那么 
我 们 要 处 理 的 不 再 是 一 个 不 可 数 和 , 而 是 一 个 可 数 和 ! 

为 什么 除了 可 数 个 oz 外 , 其 余 的 oz 都 等 于 0 呢 ? 设 


S 1 1 
三 : L 一 了 <az 芝 一 f. 
Sn 人 ZE9 并且 < ;) 


5 = 加 5, 
w= 
(其 中 so 是 由 全 体 满足 az > 1 的 ze 5 组 成 的 ). 记 住 , a 是 非 负 的 , 所 以 


Das 之 》， Ga 

ZES ZESn 
如 果 某 个 5,, 中 有 无 穷 多 个 元 素 , 那么 当 x 取 遍 5,, 中 所 有 值 时 , az 的 和 就 是 无 穷 
大 的 , 这 意味 着 当 x 取 遍 5 中 所 有 元 素 时 , ax 的 和 也 是 无 穷 大 , 这 与 和 是 有 限 的 假 
设 相互 矛盾 . 因此, 每 个 S。 都 包含 了 有 限 多 个 元 素 , 又 因为 有 限 集 的 可 数 并 也 是 
可 数 的 , 所 以 结论 就 是 , 为 了 保证 ”cs az 是 一 个 有 限 和 , 除了 可 数 个 oz 外 , 其 余 
的 az 都 必须 为 0. 


8.5 总 结 


本 章 是 上 一 章 的 自然 续篇 , 原因 是 我 们 重新 讨论 了 关于 连续 型 随机 变量 的 所 有 
性 质 . 但 是 , 在 把 离散 型 随机 变量 的 结果 和 符号 过 渡 到 连续 型 随机 变量 的 过 程 中 ， 
存在 着 一 些 问题 . 斯 坦 尼斯 耶 (《 更 凌乱 的 思绪 》, 1968) 的 看 法 可 能 是 正确 的 , 他 写 
道 ;“ 我 不 认同 数学 , 0 的 总 和 是 个 可 怕 的 数字 . ” 

我 觉得 “可 怕 ” 有 些 夸 张 , 这 种 说 法 可 能 是 为 了 更 好 地 体现 幽默 , 而 与 数学 的 
准确 性 无 关 , 但 这 句 话 确实 指出 了 连续 型 和 离散 型 随机 变量 之 间 的 关键 区 别 . 在 概 
率 论 中 , 不 可 数 个 0 之 和 可 以 是 0 和 1 之 间 的 任何 一 个 有 限 数 ! 这 要 求 我 们 在 下 
究 这 个 理论 时 必须 非常 小 心 . 尤其 是 , 我 们 不 可 能 求 出 任意 多 个 事件 的 概率 , 而 只 
能 求 出 某 些 事件 的 概率 . 也 就 是 说 , 我 们 通常 计算 的 是 可 数 个 事件 的 概率 . 

就 像 离散 型 随机 变量 那样 , 连续 型 随机 变量 也 有 概率 密度 函数 和 累积 分 布 函 
数 . 虽然 这 里 只 对 CDF 进行 了 简单 的 介绍 , 但 我 们 会 在 第 10 章 中 看 到 它 的 重要 作 
用 . 特别 是 , 在 有 了 CDF 之 后 , 我 们 可 以 通过 一 个 熟悉 的 随机 变量 来 轻松 地 了 解 另 
外 一 个 相关 的 随机 变量 . 
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8.6 习 题 
习题 8.6.1 ” 设 /是 一 个 连续 函数 , 并 且 严 (z) = G'(z) = f(z). 证 明 : F(x) - G(z) 是 一 个 
常数 . 
习题 8.6.2 ” 设 了 是 一 个 连续 函数 ; 假设 F(x) = G”(z) = f(z) 和 (x) = G(x) 至 少 对 天 


个 不 同 的 z 成 立 . 能 保证 和 G 始终 相等 的 大 的 最 小 值 是 多 少 ? 


言 右 


个 长 


习题 8.6.3 ”证 明 : 在 

其 他 点 处 均 连续 , 那么 该 
情况 又 如 何 ? 

习题 8.6.4 已 知 
于 co， 


都 存在 唯 
不 可 积 . sin(z)/z 可 积 吗 ? 
习题 8.6.5 


422 十 5z 十 2 
:0-1 


如 果 不 是 , 那么 找到 一 个 C 


在 这 样 的 C. 


和 


限 的 


下 面 的 函数 fx 是 不 是 某 个 


区 间 上 , 如 果 一 个 函数 在 该 


lim 
A,B—o0 


的 极限 , 那么 了 就 可 积 . 订 


Ie f(z)dz 


多 间 内 除 有 限 多 个 点 之 外 的 
函数 是 黎 曼 可 积 的 . 如 果 这 个 函数 在 无 限 多 个 点 处 不 连续 , 那么 


7 : 民 一 民 是 一 个 非 负 连 续 函 数 . 如 果 不 管 4 和 B 以 什么 样 的 方式 趋 近 


习题 8.6.6 


描述 连续 型 随机 变 直 


的 三 个 实际 应 用 . 


本 章 已 有 


不 要 使 


是 离散 的 还 是 连续 的 ; 根 ] 


习题 8.6.7 ”判断 下 列 随机 变量 


时 你 的 到 


散 的 , 也 可 以 看 作 连 续 的 ! 

(a) T, 你 到 达 教 室 的 时 间 . 

(b) T', 你 到 达 教 室 的 时 间 , 具体 到 分 钟 . 

(c) N, 报名 参加 概率 论 课程 的 孩子 数 . 

(d) G, 你 在 考试 中 获得 的 分 数 , 满分 是 100 分 . 

(e) 瑟 , 你 所 在 的 概率 论 课 上 , 学 生 的 平均 身高 . 

(f) 5, 建造 威廉 姆 斯 学 院 新 科学 大 楼 所 需 的 砖 瓦 数 . 
(g) D, 太阳 与 沃 尔 夫 359 星之 间 的 距离 . 


FE 明 : f(x) = zexp( 一 |z|) 可 积 , 但 g(x) = 2/(1+x?) 
随机 变量 X 的 概率 密度 函数 : 
若 0<zxz<2 
其 他 ? 
使 得 函数 g(x) = Cf(x) 是 个 概率 密度 函数 , 或 者 证 明 不 存 


的 例子 . 
! 解 , 有 些 变量 既 可 以 看 作 离 


习题 8.6.8 ”找到 满足 


列 条 件 


的 离散 型 随机 变量 X, 或 证 明 世 


X, 或 证 明 其 不 存在 : 对 于 任意 一 个 介 于 


不 存在 : 在 17 和 17.01 之 间 


已 
可 


可 以 找到 一 个 z, 使 得 产 (z) = 2, 这 里 的 fx 是 概率 密度 函数 . 

习题 8.6.9 ”找到 满足 下 列 条 件 的 连续 型 随机 变量 
17 和 17.01 之 间 的 z, 均 有 fx(z) = 2; 这 里 的 fx 是 概率 密度 函数 . 

习题 8.6.10 ” 设 X 是 一 个 连续 型 随机 变量 , 它 的 pdffx 满足 fx(z) = fx(-z). 你 能 
出 关于 Fx ( 即 CDF) 的 哪些 内 容 ? 


习题 8.6.11 证明: 


0 若 z<0 

是 一 个 概率 密度 函数 . 它 对 应 的 累积 分 布 函数 Fx 是 什么 ? 

习题 8.6.12 ”对 于 任意 的 z, 均 有 Fx(z) = er*, 那么 Fx 是 一 个 累积 分 布 函 数 吗 ? 如 果 是 
那么 它 对 应 的 概率 密度 函数 是 什么 ? 

习题 8.6.13 Fx(z) = 1- i 名 z 是 一 个 累积 分 布 函数 吗 ? 如 果 是 , 那么 它 对 应 的 概率 密度 函 
数 是 什么 ? 

习题 8.6.14 Fx(z) = 当 + 二 是 一 个 累积 分 布 函 数 吗 ? 如 果 是 , 那么 它 对 应 的 概率 密 
度 函 数 是 什么 ? 

习题 8.6.15 ” 设 X 是 一 个 连续 型 随机 变量 . (a) 证 明 : Fx 是 一 个 单调 不 减 的 函数 , 也 就 是 
说 , 如 果 z < 多 那么 Fx(z) < Fx (y). (5) 设 U 是 一 个 随机 变量 , 它 的 CDF 是 


人 若 0 和 zz< oo 


0 若 z< 0; 
Prr(zZ) 一 42 若 0<z<l; 
1 若 z > 1. 


设 已 是 任意 一 个 严格 增加 的 连续 函数 . 当 x 一 -co 时 , P(x) 的 极限 是 0; 当 z 一 co 
时 , 五 (x) 的 极限 是 1. 证 明 : Y = fF-1(U) 是 一 个 CDF 为 的 随机 变量 . (这 道 习 题 非 
常 重要 ; 利用 一 个 服从 均匀 分 布 的 随机 变量 , 我 们 能 构造 出 许多 随机 变量 .) 
习题 8.6.16 ”混合 型 随机 变量 是 满足 下 列 条 件 的 随机 变量 : 在 有 限 多 个 或 可 数 多 个 点 处 , 其 
概率 密度 函数 是 正 的 概率 , 在 其 他 范围 内 则 与 连续 型 随机 变量 相似 .考虑 一 个 混合 型 随 
机 变量 XX. 对 于 整数 ww 有 Prob(X = n) = 去 ; X 的 连续 部 分 存在 一 个 概率 密度 函数 
f, 它 定 义 在 不 取 整 数 的 实数 集 上 , 其 表达 式 为 
1 


ee 若 z>1 
= 27? 
4 | 其 他 


mn 


习题 8.6.17 ”描述 混合 型 随机 变量 的 两 个 实际 应 用 . 
习题 8.6.18 ”假设 我 们 有 一 个 单位 半径 (以 原点 为 中 心 ) 的 圆 靶 . 在 这 个 圆 丢 上 , 飞镖 落 在 某 
给 定 区 域 的 概率 与 该 区 域 的 面积 成 正比 . 如 果 把 飞镖 与 原点 之 间 的 距离 看 作 一 个 随机 变 
量 , 那么 这 个 随机 变量 的 PDF 是 什么 ? 
习题 8.6.19 ”考虑 上 一 题 的 圆 靶 . 如 果 把 飞镖 与 原点 在 x 方向 上 的 距离 看 作 一 个 随机 变量 ， 
那么 这 个 随机 变量 的 PDF 是 什么 ? 
习题 8.6.20 ”如 果 飞 镖 与 原点 的 距离 x 服从 均匀 分 布 , 那么 飞镖 落 在 某 给 定 区 域 的 概率 如 何 
] z 来 表示 ? 
习题 8.6.21 ”给 出 一 个 连续 的 概率 密度 函数 , 使 得 对 于 任意 的 z, 函数 值 始终 为 正 (不 为 0). 
习题 8.6.22 ”假设 上 和 9 都 是 概率 密度 函数 . 为 了 保证 af + bg 一 定 是 概率 密度 函数 , a 和 
b 应 该 满足 什么 条 件 ? 


证 明 : 这 是 一 个 合理 的 概率 密度 函数 . 
的 


习题 8.6.23 ” 设 X 和 Y 是 两 个 连续 型 随机 变量 , 它们 的 概率 密度 函数 分 别 是 fx 和 fy. (a) 


当 c 取 什 么 值 时 , cfx(z) 十 (1 一 c)fy(x) 是 一 个 概率 密度 函数 ? (b) 能 否 找到 一 个 
等 于 fx (zx)fy (7x) 的 随机 变量 ? 


PDF 


习题 8.6.24 ”能 不 能 找到 一 个 C, 使 得 f(z) = C exp( 一 x 一 exp( 一 zx)) 是 一 个 概率 密度 函数 ， 


其 中 -co <z < co? 


习题 8.6.25 ”假设 你 正在 旅行 , 有 两 个 航班 要 赶 . 不 六 的 是 , 你 没有 做 好 计划 , 中 间 没 有 安排 


富 留 时 间 ; 也 就 是 说 , 如 果 第 一 个 航班 延误 了 ,而 下 一 个 航班 又 准时 起 飞 ,那么 你 前 


i 会 错 


过 第 二 个 航班 , 这 将 毁 掉 你 整个 旅行 计划 . 给 出 一 个 不 合理 的 假设 , 即 认为 航班 延误 是 相 


互 独立 的 . 也 就 是 说 , 如 果 你 的 第 一 个 航班 延误 了 , 那么 它 对 后 续航 班 延 误 的 可 能 性 没有 


任何 影响 . 另外 , 假设 航班 准时 起 飞 的 概率 是 75%; 如 果 航 班 延 误 了 , 那么 它 恰好 延误 t 
分 钟 的 概率 是 1/ 妇 , 其 中 t 可 以 取 任意 非 负 实数 . 你 不 会 错过 第 二 个 航班 的 概率 是 多 少 ? 


习题 8.6.26 ”编写 一 些 代码 来 模拟 上 一 题 的 航班 问题 . 将 模拟 扩展 到 两 个 以 上 的 航班 ， 
出 你 不 会 错过 所 有 航班 的 概率 . 


习题 8.6.27 ” 设 X 是 一 个 混合 型 随机 变量 . 对 于 整数 n, 有 Pr(X = n) = 1/3”; X 的 连续 


部 分 存在 一 个 概率 密度 函数 f, 它 定义 在 不 取 整 数 的 实数 集 上 , 其 表达 式 为 
1/2z2 若 z>1 
(z) = | 
0 其 他 . 
求 X 的 累积 分 布 函数 . 
习题 8.6.28 ” 设 在 [0,1] 中 均匀 取 值 , 那么 它 的 概率 密度 函数 是 
1 若 0<z< 
| 0 其 他 . 
X 的 第 一 位 数字 是 偶数 的 概率 为 多 少 ? X 的 每 一 位 数字 都 是 偶数 的 概率 是 多 少 ? 


1 
fx(7x)= 


第 9 章 ”工具 : 期 望 


温 斯 顿 ” 雷 德 莫 尔 : 我 们 有 工具 ! 我 们 是 天 才 ! 
彼得 ” 温 克 曼 : 现在 是 Miller 时 间 ! 
一 一 《 捉 鬼 敢 死 队 》(1984) 


稍 后 , 我 们 会 深入 地 研究 一 个 又 一 个 关于 随机 变量 的 例子 . 没 错 , 这 样 的 例子 
有 很 多 , 并 且 都 值得 去 了 解 . 你 知道 的 随机 变量 和 分 布 越 多 , 就 越 有 可 能 找到 合适 
的 模型 来 模拟 你 所 关心 的 问题 . 这 就 是 我 们 给 出 一 系列 章节 , 其 中 每 章 都 专注 于 一 
个 或 两 个 随机 变量 的 原因 . 

本 草 和 接 下 来 几 童 的 目的 是 集中 讨论 不 同 随机 变量 之 间 的 相似 之 处 . 特别 是 ， 
有 一 些 工 具 和 技巧 可 以 帮助 我 们 很 好 地 理解 这 些 内 容 . 在 掌握 了 这 些 方法 之 后 , 你 
几乎 可 以 分 析 任 何 随 机 变量 . 我 们 将 集中 考察 五 个 方面 : 本 章 的 期 望 和 算 (从 而 引 
入 均值 、 标 准 差 和 方差 这 些 概 念 ), 第 10 章 的 卷 积 (可 以 把 相互 独立 的 随机 变量 结 
合 起 来 ) 和 变量 替换 (我 们 可 以 从 一 个 随机 变量 过 渡 到 另 一 个 随机 变量 ), 以 及 后 面 
几 章 对 恒等式 求 微分 (有 助 于 找到 均值 、 方差 和 其 他 算 ). 
后 面 有 关 特 定 随 机 变量 的 几 音 都 遵循 了 相同 的 模式 : 先 给 出 一 个 概率 密度 函 
数 , 然后 研究 与 之 相关 的 随机 变量 . 各 章 的 计算 非常 相似 , 最 大 的 不 同 在 于 求 积分 
或 者 求 和 的 难度 . 从 非常 简单 (均匀 分 布 的 情形 ) 一 直到 不 可 能 计算 出 来 ( 正 态 分 
布 的 情形 ). 遗憾 的 是 , 后 一 种 情况 会 更 常见 . 用 一 个 漂亮 的 解析 表达 式 来 计算 积 4 
是 非常 罕见 的 , 而 求 和 则 更 难 ! 在 实践 中 , 我 们 必须 要 求助 于 数值 逼近 或 级 数 展开 . 
一 般 来 说 , 我 们 可 以 得 到 想 要 的 精度 , 但 这 是 个 大 难题 ; 稍 后 会 详细 讨论 . 

在 深入 研究 这 些 特殊 分 布 之 前 , 我 们 要 花 点 时 间 看 一 下 讨论 连续 型 概率 分 布 党 
用 的 一 些 工具 . 我 们 已 经 见 过 一 些 , 稍 后 还 将 看 到 更 多 相关 细节 . 第 一 个 工具 是 期 
望 值 和 矩 . 我 们 将 同时 考察 连续 型 随机 变量 和 离散 型 随机 变量 . 从 本 质 上 看 , 这 两 
个 定义 的 唯一 区 别 是 用 求 积 分 来 代替 求 和 . 实际 上 , 为 了 给 出 统一 的 表述 ,高 等 4 
析 学 教材 通常 会 给 出 一 个 更 一 般 的 积分 概念 , 这 样 就 可 以 同时 处 理 两 种 情形 . 本 书 
不 会 这 样 做 而 是 会 把 结果 分 别 写 成 求 和 与 求 积分 的 形式 . 

这 里 的 安排 与 你 在 大 多 数 教材 中 看 到 的 不 同 . 原因 是 本 书 则 在 对 其 他 教材 做 出 
补充 . 因此 , 本 章 (以 及 接 下 来 的 两 章 ) 要 做 的 是 收集 一 些 最 重要 的 技巧 , 并 对 这 个 
理论 展开 描述 . 虽然 前 面 有 一 些 关于 如 何 使 用 这 些 结果 的 例子 , 但 大 部 分 实际 应 用 
都 留 在 后 面 几 章 介绍 . 如 果 把 本 书 当 作 补 充 材料 , 那么 你 应 该 已 经 见 过 很 多 这 样 的 


NS 


Ti 
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例子 和 应 用 了 , 本 章 和 接 下 来 的 儿童 将 被 看 作 一 个 中 心 存储 库 , 用 来 存储 你 需要 的 
所 有 事实 . 如 果 你 把 本 书 当 作 教材 , 也 不 用 担心 : 我 们 很 快 就 会 讲 到 这 些 例子 . 我 
的 一 位 数学 教授 塞 尔 日 ” 兰 曾 在 书 中 写 道 : 如 果 一 本 书 必须 按照 页 码 次 序 来 阅读 ， 


那么 这 将 是 件 令 人 感到 遗憾 的 事 . 本 书 有 很 多 种 好 的 、 合 到 


中 一 种 , 而 你 必须 做 出 自己 的 选择 . 


9.1 ” 微 积 分 预备 知识 


本 章 的 主要 概念 是 矩 . 在 于 9.2 节 给 出 定义 之 前 , 我 们 先 回 顾 一 个 微 积 分 中 的 
概念 , 虽然 它 乍 看 起 来 好 像 并 不 相关 , 但 实际 上 能 为 我 们 带 来 很 大 帮助 . 如 果 你 没 


LE 的 阅读 次 序 , 这 只 是 其 


学 过 微 积 分 , 那么 连续 型 随机 变量 将 会 是 一 个 挑战 , 因为 月 


日 来 研究 连续 型 随机 变量 


的 大 部 分 技巧 都 会 涉及 微 积分 知识 . 如 果真 是 这 样 , 你 可 以 略 读 或 跳 过 本 ,继续 


看 后 面 的 内 容 , 并 专注 于 离散 型 随机 变量 . 


那么 f 在 a 点 处 的 ” 阶 泰勒 级 数 就 是 


泰勒 级 数 : 如 果 f 是 n 次 可 微分 的 (其 中 f(z) 表示 f 在 x 处 的 有 阶 导数 )， 


(aq) 


处 的 值 . 


我 们 把 f(a)/hl 称 为 f 关于 a 的 第 个 泰勒 系数 . 在 很 多 应 用 中 , 我 们 希望 得 
到 原点 处 的 泰勒 级 数 , 所 以 a = 0 (在 一 些 教材 中 , 这 被 称 作 妻 克 劳 林 级 数 )， 泰 
勒 级 数 给 出 了 函数 及 其 导数 在 一 点 处 的 性 质 , 由 此 可 以 估算 上 


该 函数 在 其 他 点 


(z—a)" 


好 . 我 们 所 做 的 是 考虑 更 多 与 函数 有 关 的 信息 . 
这 样 说 吧 , 假设 你 想 了 解 函数 f 在 某 个 以 原点 为 


在 图 9-1 中 , 我 们 把 正弦 函数 及 其 三 阶 泰勒 级 数 x 一 23/3! 和 七 阶 泰勒 级 数 
Zz 一 23/31 十 x/51 一 277! 进行 了 比较 . 虽然 这 两 种 逼近 都 不 错 , 但 七 阶 的 情形 会 更 


P 心 的 大 区 间 的 情况 如果 


只 能 获得 一 条 信息 , 那么 应 该 询问 f(0) 的 情况 . 在 知道 了 这 一 点 之 后 , 该 如 何 预测 
了 (0.1) 或 f(--0.2) 呢 ? 最 好 的 猜想 是 , 它们 也 等 于 了 (0); 我 们 
是 递减 的 , 因此 为 了 减少 风险 , 用 一 个 常数 函数 来 逼近 f. 在 没有 其 他 信息 的 情况 
下 , 这 就 是 最 好 的 选择 . 这 个 常数 函数 就 是 零 阶 泰勒 级 数 展 


不 清楚 f 是 递增 的 还 


式 ; mn(z) = f(0). 


但 是 , 如 果 我 们 有 更 多 信息 , 那么 情况 是 什么 样 的 ? 现在 , 除了 /0), 假设 我 们 
还 知道 男 一 个 与 函数 有 关 的 事实 . 一 个 不 错 的 选择 是 知道 (0) 是 多 少 . 为 什么 这 
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是 个 不 错 的 选择 ? 导数 能 给 出 瞬时 变化 率 . 这 意味 着 在 局 部 范围 内 ( 换 名 话说 , 当 zx 
接近 于 0 时 ), f(0) 十 了 (0)z ( 即 五 (z)) 可 以 很 好 地 逼近 我 们 的 函数 . 按照 下 面 的 思 
路 想 一 想 : (0) 是 你 在 0 时 刻 的 起 始 位 置 , (0) 是 你 的 初始 速度 , 如 果 速 度 保持 不 
变 , 那么 到 时 刻 xz, 你 移动 了 了 "(0) .zz 的 距离 , 所 以 现在 的 位 置 是 f(0) 十 (0)z. 


0.5| 


—1.0r 
图 9-1 sinz 和 它 的 三 阶 泰勒 级 数 (上 图 ), 以 及 七 阶 泰勒 级 数 (下 图 ) 


如 果 把 /六 (0) 也 考虑 进来 , 那么 情况 就 更 复杂 了 . (注意 , J”(0) 的 物理 解释 是 加 
速度 , 即 速度 的 变化 率 .) 你 或 许 会 认为 二 阶 泰勒 级 数 就 是 f(0) + 了 (0)z 十 j(0)z2 
但 这 个 结果 有 点 偏差 : 最 后 一 项 应 该 是 "(0)z?/2!. 为 什么 要 除 以 21? 对 于 f 在 原 
点 处 的 n ns le 我 们 应 该 这 样 来 看 : T,(0) = f(0), (0) = 了 (0), 以 
此 类 推 , 直到 TY(0) = 7o0(0). 换 旬 话说 , 让 近似 值 与 给 定 函数 值 相等 , 并 确保 原 
点 处 的 前 n 阶 导数 与 给 | n 阶 导 数值 相等 ， 如 果 不 除 以 21, 那么 工 ,(zx) 
在 原点 处 的 二 阶 导数 就 不 等 于 f 在 原点 处 的 二 阶 导 数 . 表 9-1 阐述 了 这 一 点 . 在 这 
里 , 我 们 考察 了 原点 处 的 三 阶 泰勒 级 数 , 并 说 明了 该 级 数 及 其 前 三 阶 导 数 与 f 及 其 
前 三 阶 导数 在 原点 处 的 值 相 等 . 
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这 部 分 内 容 的 寓意 是 , 知道 的 信息 越 多 , 近似 就 越 好 . 图 9-1 为 这 种 说 法 提供 
了 强 有 力 的 证 据 . 有 趣 的 是 , 看 看 由 此 能 推出 什么 . 我 们 希望 能 由 泰勒 系数 推导 出 
函数 换 句 话说 , 泰勒 系数 的 序列 可 以 唯一 地 确定 函数 .遗憾 的 是 , 事实 并 非 如 此 
(例子 请 参阅 19.6 节 的 式 (19.3)), 这 就 导致 了 概率 论 中 的 许多 束 手 问题 . 


表 9-1 f(z) 在 原点 处 的 三 阶 泰勒 级 数 


Ts(z) = f(0) + fOr+ V+ EO T3(0) = f(0) 

T(z) = f(0) + 1" (0)z + EO? TY(0) = 1’(0) 
TY(z) = "(0) + jw(O)z TY(0) = 17(0) 
TY (z) = jw(0) Ty"(0) = jw(0) 


尽管 存在 一 些 问题 , 但 在 很 多 情况 下 , 泰勒 系数 仍然 可 以 提供 大 量 关 于 函数 的 
有 用 信息 . 为 了 帮助 我 们 理解 随机 变量 的 概率 密度 函数 , 现在 进一步 推广 这 种 思路 . 


9.2 ” 期望值 和 算 


9.1 节 讨 论 了 泰勒 系数 以 及 由 它们 建立 的 函数 , 即 泰勒 级 数 , 是 如 何 提供 大 量 
与 函数 有 关 的 信息 的 . 现在 , 我 们 找到 了 与 概率 密度 函数 相似 的 量 . 
回忆 一 下 , 随机 变量 X 是 定义 在 概率 空间 上 的 . 这 意味 着 我 们 有 一 个 结果 外 
合 Q 和 一 个 定义 在 o 代数 上 的 概率 函数 , 其 中 o 代数 是 由 9 的 子 集 组 成 的 . 随机 
变量 有 一 个 概率 密度 函数 (PDF), 它 可 以 告诉 我 们 随机 变量 取 某 些 特定 值 的 概率 . 
接 下 来 , 我 们 要 定义 PDF 的 矩 . 这 与 9.1 节 的 情形 相似 . 在 上 一 节 中 , 泰勒 系数 提 
供 了 关于 函数 的 信息 , 但 现在 矩 能 够 提供 与 PDF 有 关 的 信息 . 


期 望 值 , 矩 : 设 X 是 定义 在 RR 上 的 随机 变量 , 它 的 概率 密度 函数 是 fx.， 函数 
9(X) 的 期 望 值 是 


fs fede 若 X 是 连续 的 
lg(X)] = 4 
g(rn) : fx (xn) 若 X 是 离散 的 


最 重要 的 情形 是 g(z) = z*. 我 们 把 E[X"] 称 为 X 的 > 阶 矩 , 把 EI(CX -- 
[X])"] 称 为 六 的 > 阶 中 心 答 . 


TL] 


要 能 算出 和 或 积分 , 就 可 以 求 出 期 望 值 和 算 . 当然 , 有 一 些 9 会 导致 期 望 不 
存在 . 一 个 显然 的 问题 是 我 们 为 什么 要 计算 期 望 . 我 们 能 得 到 什么 信息 ? 要 想 弄 清 
楚 期 望 能 带 来 哪些 信息 , 就 必须 了 解 生 成 函数 (在 第 19 章 中 引入 ), 不 过 现在 可 以 


SS 
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简单 地 说 一 下 . 简单 地 说 , 中 心算 与 泰勒 系数 相似 . 正如 得 到 的 泰勒 系数 越 多 , 对 函 


数 的 逼近 惑 越 好 . 知道 更 多 的 矩 能 让 我 们 更 好 地 型 
中 , 我 人 
矩 ) 和 方差 (这 是 个 二 阶 中 心 矩 


在 9.3 节 


] 将 提 


在 8.3 节 中 , 我 们 看 到 


6 


书 注 意 力 集中 在 两 个 最 重要 的 矩 上 


LE 解 概率 密度 函 


上 , 即 均值 (这 是 个 一 
). 本 克 的 最 后 会 给 出 几 个 计算 期 望 的 例子 . 


数 的 形状 和 性 


十 /人 . 


阶 


一 (2 十 3z 一 5z2) 若 0<z<1 
=411 
fx(7) | 其 他 
是 连续 型 随机 变量 的 概率 密度 函数 . 我 们 将 计算 : (1) 7 阶 矩 , 其 中 7 > 0; (2) g(X) = 
eX 的 期 望 值 ; (3) g(X) = 1/X 的 期 望 值 . 注意 , 当 x 不 属于 [0,1 时 , 概率 密度 函 
数 fx(z) = 0, 所 以 可 以 把 积分 区 间 限 制 在 0 到 1 上 . 这 是 一 个 经 典 问题 . 它 是 被 
精心 设计 出 来 的 一 一 没 人 关注 这 里 的 随机 变量 及 其 概率 密度 函数 . 这 里 的 精心 设 
计 是 为 了 强调 一 些 重要 问题 . 我 们 会 看 到 , 要 想 成 功 地 掌握 矩 的 知识 , 必须 熟知 很 
多 微 积分 技巧 . 
(1) 为 了 求 出 rz0 时 的 7 阶 矩 , 必须 算出 EE[X"], 即 
[X7] = f= . 于 人 2 二 37 一 5z2)dz 
0 
= (2z7 十 3zr+1 一 5z7+2)d7 
6 /2zrf+ll1 3zr+211 5z7r+311 
= 地 (| r+2lo 7 十 3 人 
_56 7r 十 11 
11(r+D)(r+2)(r+3) 
令 7=1, 就 得 到 了 一 阶 矩 , 即 9/22. 上 只要” > -1 即使 7 取 负 数 , 积分 也 是 有 意义 
的 (如 果 7 < 一 1, 那么 xz 乘 以 一 个 常数 的 积分 是 发 散 的 ). 


(2) 为 了 求 出 


为 了 完成 计算 , 我 人 
分 的 分 部 积分 法 


第 一 个 


ex 的 期 望 值 , 要 计算 


6 
行 名 十 3z 一 572)dz 


6 1 1 二 
@ | edz 十 3/ ze dz— 5 / werdr) 
11 Ny 


] 要 回顾 一 


中介 


我 们 有 


 ( 宙 


从 检 


= 
0 


些微 积分 的 技巧 , 尤其 是 
就 是 ex | 二 se 二 1 


用 来 计算 第 


二 个 和 第 三 个 积 


| -f vdu. 
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对 于 第 二 个 积分 , 一 个 很 好 的 选择 是 令 w= x 且 dv = ezdz. 这 样 就 得 到 了 dw = dz 
和 w==e”, 所 以 新 的 被 积 函 数 就 是 e* (困难 部 分 ). 这 比 最 初 的 被 积 函 数 ze” 要 好 
得 多 . 反 过 来 , 如 果 让 ww = ez 且 dv = zdz, 那么 就 有 du = ezdz 和 w= z2/2, 这 会 
给 出 非常 糟糕 的 被 积 函 数 3z?e*. 换 句 话说 , 我 们 得 到 了 难以 计算 的 积分 , 因为 被 
积 函 数 是 指数 函数 与 多 项 式 的 乘积 , 而 我 们 对 w 和 w 的 选择 实际 上 增加 了 多 项 式 
的 次 数 ! 这 就 是 为 什么 另 一 个 选择 更 好 , 因为 它 降 低 了 多 项 式 的 次 数 . 我 们 看 到 


1 1 1 
. Ze"rdzZ = xe” -/ erdz = e—(e—1)= 1 
0 9 0 


(为 了 节省 时 间 , 我 们 利用 了 之 前 的 结果 , 即 万 erdz =。 一 1). 
现在 还 剩 下 人 zZ2erdz. 我 们 用 分 部 积分 法 来 计算 . 令 v=z2 且 do =erdz (这 
是 “正确 ”的 选择 , 因为 多 项 式 的 次 数 减少 了 1). 于 是 du = 2zdz, v = e", 并 且 


1 
-2/ ze*dr = e 一 2 
0 0 


( 记 住 , 我 们 刚刚 证 明了 ze*dz = 1, 在 这 里 直接 利用 该 结论 ). 
把 这 三 个 积分 结合 在 一 起 , 我 们 得 到 了 
[e*] = .le PC 


(3) 最 后 , 计算 9(X) = 1/X 的 期 望 值 . 我 们 需要 考察 下 面 这 个 积分 
7 图 = 3 (2 +3 527)de 
0 


6 1 dz 1 1 
-五 (2/ ey dr-5/ rdz 

虽然 后 两 个 积分 存在 , 但 第 一 个 积分 不 存在 . 1/z 的 原 函 数 是 log z, 但 它 在 1 处 的 

函数 值 是 0, 在 0 处 的 函数 值 趋 近 于 -co. 因此 , 这 个 期 望 不 存在 . 这 里 的 问题 是 ， 

函数 1/z 在 原点 附近 趋 近 于 无 穷 大 的 速度 太 快 , 以 至 于 无 法 积分 (参见 习题 9.10.3). 

现在 考察 一 个 离散 的 例子 . 设 X 是 抛 括 一 枚 均匀 硬币 3 次 后 出 现 正面 的 次 数 . ©O 
在 7.1 节 和 7.2 节 中 , 我 们 详细 地 讨论 了 这 个 随机 变量 , 并 证 明了 当 x 4 {0,1,2,3} 

时 , fx(x) = 0, 以 及 


1 
人 2Z2ezdz = zZ2ez 
0 


fx(0) = fx(1) = < fx(2) = fx(3) = . 


现在 计算 X? 的 期 望 值 : 


3 
1 3 
[X2?] = > 12. fx(k) = 2 | Ds | 22. 
k=0 
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这 个 结果 看 起 来 很 有 趣 . 抛 括 硬 币 3 次 , 而 X2 ( 即 了 


就 是 3. 这 是 巧合 吗 ? 如 果 抛 掷 硬 币 4 
用 球 表示 抛掷 一 枚 均匀 人 硬币 n 
入 了 下 标 , 这 样 就 能 快速 看 到 一 


E 面 次 数 的 平方 ) 的 
次 , X? 的 期 望 值 会 是 4 吗 ? 我 们 来 看 一 看 ! 
次 后 出 现 正面 的 次 数 (我 们 在 随机 变量 中 力 


LI 
La 


其 望 值 


抛 括 了 多 少 次 硬币 ). 7.2 节 中 讨论 过 这 个 随机 变 


量 ; 它 是 一 个 服从 二 项 分 布 的 随机 变量 , 其 概率 密度 函数 为 
Tn 
2 若 ke {0,1,..….,n} 
fy,(k) = 四 
0 其 他 . 
因此 


[73 = > = 去 2 (> 


遗憾 的 是 , 这 个 数 看 起 来 并 不 是 我 们 希望 的 那 相 


fF. 哦 , 对 了 . 卷 起 袖子 去 算 一 下 , 我 


们 会 看 到 
ElY?] = 5, ElY2| = 35, ElYs] = 3, ElY#] = 5, 
[Y2] = 二 2 
上 述 模式 并 没有 持续 太 久 ! 好 吧 , 结果 不 是 n 这 么 简单 , 但 令 人 惊讶 的 是 , 我 们 


的 猜测 距离 事实 并 不 太 远 ， 如果 考虑 了 所 有 的 二 次 多 项 式 , 我 们 会 发 现 f(z) 
jn2 十 所 = na+D/4 恰好 与 上 面 的 结果 一 致 ! 为 什么 要 考虑 二 次 多 项 式 呢 ? 因 
我 们 要 考察 的 是 平方 , 所 以 尝试 拟 合 一 个 二 次 方程 应 该 是 合理 的 . 在 第 11 章 中 
们 会 看 到 如 何 利用 对 恒等式 求 微分 这 种 技巧 来 训 


为 
我 


Es} 


E 明 像 上 面 这 样 的 公式 . 

这 两 个 例子 阐明 了 经 常 发 生 的 情况 . 通常 情况 下 , 连续 型 随机 变量 的 期 望 值 

能 求 的 积分 , 但 离散 型 随机 变量 的 期 望 值 往往 涉及 二 项 式 系数 求 和 . 把 这 些 和 写 

解析 表达 式 要 比 求 积分 难得 多 , 但 是 仍 有 一 些 高 等 技巧 (对 恒等式 求 微分 就 是 其 
之 一 ) 可 以 很 好 地 应 用 于 某 些 情形 . 
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现在 接着 往 下 看 . 我 们 从 泰勒 系数 开始 


介绍 , 然后 定义 了 概率 密度 函数 的 和 


是 
成 
中 


| 


这 些 算 


Du 


目标 是 试 着 用 微 积分 知识 来 进一步 充实 这 些 内 容 . 尤其 是 , 我 希望 你 明 
如 何 提供 与 概率 密度 函数 有 关 的 信息 


这 两 个 重要 的 矩 分 别 有 自 己 的 名 称 : 均值 和 方差 . 


的 . 一 阶 矩 和 二 阶 中 心 距 是 最 重要 的 两 个 外 


iul 
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均值 和 方差 : 设 X 是 一 个 连续 型 或 离散 型 的 随机 变量 , 它 的 概率 密度 函数 是 fx. 


(1) X 的 均值 ( 即 平均 值 或 期 望 值 ) 是 一 阶 矩 . 我 们 提 


( 当 随 机 变量 很 明确 时 , 通常 不 给 出 下 标 X, 而 只 


巴 它 表示 为 


oIX] 或 jx 
写 由. 有 具体 地 说 ， 


I rz: fx(r)dz 


-| 


(2) X 的 方差 ( 记 作 cox 或 Var(X)) 是 二 阶 吕 


日 :大 


若 X 是 


若 X 是 离散 的 . 


(X 一 jx)? 的 期 望 值 . 同样 , 当 随 机 变量 很 明确 时 , 通常 不 给 出 下 标 X， 


只 写 o2. 把 它 完整 地 写 出 来 , 就 是 


FP 心 距 , 也 可 以 说 是 g(X) = 


{nx) x(n) 若 X 是 连续 的 
2 过: 一 Co 
> (z-Apx)2Px(zn) 若 X 是 离散 的 . 


CT 


这 个 式 子 把 方差 和 X 的 前 二 阶 矩 联系 起 来 , 在 很 多 计算 中 都 非常 有 用 . 
标准 差 是 方差 的 平方 根 , 即 cx = VoX. 
(3) 技术 说 明 : 为 了 保证 均值 存在 , 我 们 希望 [3 |zx 
形 下 ) 或 5, |zn|fx (zn) 


%[X], 所 以 在 一 系列 代数 运算 后 (参见 引 理 9.5.3), 我 们 有 


? = EX- 


n 


oIX]?. 


IX] — 


[|X])?] = 


和 续 的 情 


jx(z)dz (在 i 
离散 的 情形 下 ) 是 有 限 的 . 


(在 


期 望 值 或 平均 值 . 如 果 从 分 布 中 不 断 地 取出 很 


这 些 概念 为 什么 重要 ? 均值 就 是 
那么 这 个 平均 值 应 该 非常 接近 于 yx. 标准 差 可 


多 值 , 然后 


对 得 到 的 结果 求 平 均值 


以 预测 出 结果 与 均值 之 间 差 距 的 波动 程度 . 标准 差 越 小 , 结果 就 越 容 易 分 布 在 均值 


附近 . 


我 们 看 


个 例子 . 假设 


个 概率 论 班 被 分 成 了 两 组 . 每 组 


PF 都 有 5 个 人 (Alica、 


Bob、cam、Danie 和 Eli 组 成 了 第 一 组 ,他 们 的 分 数 依 次 为 40、45、50、55 和 


60; Fred、 Gabrielle、 Henry、 Igor 和 


Justine 组 成 了 第 二 组 , 分 数 依次 为 0、25、50、75 


和 100). 我 很 难 把 事情 写 得 严谨 , 因为 现实 中 的 人 在 面 对 这 些 问题 时 都 是 很 随意 的 ， 
但 是 能 看 到 这 些 残 酷 的 细节 是 件 好 事 . 我 们 希望 所 有 学 生 都 能 得 到 平等 的 对 待 , 因 
此 在 每 组 中 , 每 个 学 生 都 被 指定 了 概率 1/5, 即 20%. 
用 X 表示 第 一 组 中 某 个 学 生 的 分 数 (所 以 X(Eli) = 60), 用 了 表示 第 二 组 中 
某 个 学 生 的 分 数 (所 以 Y(Gabrielle) = 25). 这 样 就 求 出 了 均值 : 
nx = 40 ur 50.5 | 00 .= = 50 


站 
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1 1 
Wy =0.=+25. 二 十 50. 


ee 三 


5 5 


5 5 5 


因此 , 这 两 个 组 的 均值 相等 . 如 果 只 知道 
现在 , 计算 方差 : 


均值 的 话 , 我 们 是 无 法 


1 


50. 


区 分 这 两 个 组 的 . 


1 
ax =(40 50)°5 +- (45 50) 
1 
十 (60 一 50) = 50 


1 
(50 50) +- (55 


1 
50)? 
) 5 


1 1 1 1 
ay 一 (0 50) 5 十 (25 50) 5 +- (50 50) +- (75 50) 


1 
十 (100 一 50)°s = 1250 


我 们 可 以 从 这 个 例子 中 学 到 很 多 东西 . 第 一 点 是 ， 即便 两 个 随机 变量 的 均值 


St 


随机 变量 的 值 是 如 何 分 布 在 均值 附近 


泛 , 为 从 0 到 100. 


等 ,它们 的 方差 也 可 以 大 不 相同 . 对 于 这 一 点 ， 我 人 


门 不 需要 太 慰 讶 .方差 用 来 衡 


的 ， 它 要 么 是 (x 一 jx)? 的 积分 , 要 么 是 


(zn 一 x)? 的 和 . X 接近 jx 的 可 能 性 越 高 , 方差 就 越 小 . 在 我 们 的 例子 中 , 第 一 
组 分 数 紧密 地 围绕 在 均值 附近 , 从 40 到 60 不 等 , 但 第 二 组 分 数 的 分 布 范围 却 很 广 


我 们 还 能 学 到 什么 ? 第 二 点 是 方差 的 大 小 . 请 注意 第 二 组 的 方差 是 多 少 : 1250. 


由 于 这 个 数 比 题目 中 的 其 他 数 都 大 , 所 以 我 们 应 该 停 下 来 思考 一 下 方差 的 物理 意 
义 . 对 数 指定 单位 是 回答 这 个 问题 的 好 方法 . 因 是 
想象 成 我 们 挣 了 50 美元 , 或 者 学 校 到 家 的 


米 , 但 第 一 组 的 方差 是 50 平方 米 , 第 二 组 的 方差 是 1250 了 


此 , 我 们 不 考虑 成 绩 是 50 分 , 而 是 
E 离 是 50 米 . 这 两 组 的 平均 距离 都 是 50 
F 方 米 . 为 什么 方差 的 单 


位 是 平方 米 ? 概率 是 没有 单位 的 , 但 因为 我 们 为 随机 变量 指定 
对 它 求 平方 时 就 会 得 到 “平方 米 ”. 这 表明 了 方差 是 个 错误 的 研究 对 象 , 我 们 应 该 


考察 它 的 平方 根 , 即 标准 差 . 为 什么 呢 ? 


了 单位 “ 米 ”, 所 以 


因为 标准 差 与 均值 的 单位 相同 (在 这 个 例 


子 , 单位 是 米 ). 第 一 组 的 标准 差 是 V50 s 7.07 米 , 第 二 组 的 标准 差 是 V1250 ~ 36.4 


米 . 这 些 值 不 仪 与 均值 的 单位 相同 , 而 


数量 级 也 相似 . 这 个 事实 值得 我 们 记录 下 


来 , 并 加 以 强调 . 


方差 与 标准 差 : 与 方差 相 比 , 标准 差 的 优势 在 于 它 和 均值 有 相同 的 单位 . 因此 ， 


标准 差 是 衡量 结果 在 均值 附近 波动 幅度 的 自然 尺度 . 


如 果 想 知道 这 些 矩 能 提供 哪些 信息 


,就 要 回顾 一 下 9.1 市 


的 泰勒 级 数 . 首先， 


泰勒 系数 越 多 , 对 函数 形状 和 性 质 的 了 解 就 越 多 . 先 来 看 一 个 关于 概率 密度 函数 的 
我 们 已 经 清楚 如 何 利用 更 多 的 矩 来 区 分 不 
同 的 PDF. 其 次 , 我 们 把 泰勒 系数 看 作 在 自然 过 程 中 添加 的 信 ， 
个 与 函数 有 关 的 事实 , 那么 为 了 推导 出 函数 在 一 个 区 间 内 的 性 质 , 我 们 会 选择 获得 


类 似 命题 . 尽管 只 讨论 了 均值 和 方差 , 但 


昌 . 如 果 只 能 获得 一 
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中 心 点 的 函数 值 . 如 果 能 得 到 两 个 值 , 那么 下 一 个 选择 自然 是 一 阶 导 数 在 中 心 点 的 
取 值 ; 如 果 能 得 到 三 个 值 , 我 们 接 下 来 会 选择 二 阶 导数 在 中 心 点 的 取 值 ; 依 此 类 推 . 
对 于 一 个 随机 变量 , 我 们 知道 它 的 概率 和 一 定 为 1, 因此 所 有 随机 变量 的 零 阶 矩 都 
是 一 样 的 . 知道 均值 类 似 于 知道 了 /0), 知道 方差 (结果 是 如 何在 均值 周围 分 布 的 ) 
类 似 于 知道 了 六 (0) (了 变化 得 多 快 ), 等 等 . 

换 种 说 法 , 如 果 只 能 得 到 一 个 有 关 随 机 变量 的 信息 , 那么 知道 它 的 平均 值 是 个 
不 错 的 选择 . 如 果 还 能 得 到 一 条 信息 , 你 就 该 问 问 随机 变量 的 值 是 如 何 分 布 的 . 在 
9.7 节 中 , 我 们 将 回答 一 个 显而易见 的 问题 :“ 接 下 来 会 发 生 什么 ?” 

是 时 候 看 一 些 例子 了 . 我 们 重新 考察 抛 撕 2 颗 均 匀 山 子 的 例子 , 随机 变量 R 人 
表示 掷 出 的 数字 之 和 . 7.2 节 给 出 了 R 的 PDF: 


也 | 


6 一 | 一 了 | i 
右 7€12,3,..….,12 
Prob(R=7)= 人 36 | 
0 其 他 . 
为 了 求 出 的 均值 , 只 需要 把 上 式 带 入 : 
12 
二 1 
一 -一 二 2 . 。 .4 12 . 一 - 
2 36 0 0 


如 果 把 这 个 和 分 割 成 两 部 分 (r < 7 和 7 > 8), 然后 使 用 整数 和 公式 与 平方 和 公式 ， 
那么 结果 会 是 一 个 漂亮 的 表达 式 , 但 是 没 必 要 这 样 做 . 这 里 只 有 11 项 一 一 计算 这 
个 和 并 不 太 麻 烦 . 如 果 使 用 的 骨 子 有 100 万 个 面 , 那么 情况 就 完全 不 同 了 ! 另外 , 我 
们 的 答案 还 通过 了 合理 性 检验 . 这 个 PDF 关于 7 对 称 , 意味 着 R 的 均值 应 该 是 7. 

方差 是 多 少 呢 ? RR 的 方差 是 


12 


6—|r—7| 
2 2 
oR= Dr 7) 
< 36 
1 2 1 35 
去 2 用 和 RE ee 
FY 36+( ) 是 二 Be 36 6 


这 说 明了 标准 差 就 是 V35/6 ~ 2.42. 
最 后 , 我 们 对 均值 定义 中 的 技术 条 件 进行 说 明 . 对 于 用 来 定义 均值 的 积分 , 只 | 
说 明 其 存在 性 是 不 够 的 .关于 被 积 函数 绝对 值 的 积分 也 必须 是 有 限 的 .虽然 这 一 
点 现在 看 起 来 不 太 重 要 , 但 后 面 的 很 多 论述 都 会 用 到 它 (参见 9.6 节 中 的 例子 ). 这 
个 关于 有 限 的 假设 可 以 交换 积分 与 求 和 的 次 序 (也 就 是 说 , 我 们 可 以 使 用 富 比 尼 定 
理 ), 这 将 带 来 很 大 帮助 . 从 本 质 上 讲 , 这 意味 着 我 们 不 必 过 于 担心 收敛 问题 . 
例如 , 考虑 下 面 的 概率 密度 函数 : 
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为 了 说 明 这 是 个 概率 密度 函数 , 回顾 东 arctan(z) = 1/(L+z2) 会 有 一 定 的 帮助 . 这 
说 明了 为 什么 会 有 正规 化 常数 1/r. 如 果 你 没有 看 出 这 一 点 或 者 想 不 起 来 了 , 也 不 
用 担心 . 正规 化 常数 是 多 少 并 不 重要 . 真正 重要 的 是 , 存在 某 个 正规 化 常数 (在 15.9 
节 中 , 我 们 会 进一步 讨论 如 何 找 到 这 个 常数 )， 因 为 这 个 函数 在 无 穷 远 处 不 会 迅速 
地 增加 或 减少 , 所 以 利用 积分 检验 可 以 看 出 这 个 积分 是 有 限 的 . 因此 , 在 进行 缩放 
后 , 这 就 是 1 个 概率 分 布 . (这 是 非常 重要 的 柯 西 分 布 .) 

均值 是 多 少 ? 为 了 得 到 答案 , 必须 计算 


下 = 过 本人 
:二 一 一 一 dz 二 一 dz. 
民 。 元 1 十 22 ee 


由 于 被 积 函 数 是 个 奇 函 数 , 而 积分 区 间 又 关于 原点 对 称 , 所 以 我 们 很 容易 认为 积 4 
值 为 0. 不 笠 的 是 , 这 是 一 个 反常 积分 , 我 们 必须 要 小 心 . 如 果 积 分 值 存 在 , 那么 不 
管区 间 端 点 是 如 何 趋 近 于 无 穷 大 的 , 我 们 都 应 该 得 到 同一 个 答案 . 换 句 话说, 不管 
A 和 B 以 何 种 方式 趋 近 于 无 穷 大 ， 


B 
1 
lim | i 
$2% /ATlty 


应 该 收敛 到 同一 个 值 . 如 果 令 4 = B, 那么 总 会 得 到 0, 但 是 当 B = 24 时 , 我 们 有 


24 4 24 
im / 4 = lim 1 2 dz+ 1/ dz | . 
4 一 co 厂 4 TI1 十 22 4 一 co\/ 12Z2 A 区 1 十 Z2 


注意 , 第 一 个 被 积 函 数 是 一 个 奇 函 数 , 而 积分 区 间 是 关于 原点 对 称 的 区 间 , 所 以 这 
个 积分 等 于 0. 于 是 ， 


24 24 
1 1 
lim / 一 一 一 一 42 = lim ,| 二 二 dz; 
4 一 oo A Tl 二 x2 4 一 co A xXl+x? 


但 是 , 当 x 较 大 时 , 最 后 一 个 被 积 函 数 其 实 就 是 z/z2 = 1/z. 严格 地 说 , 这 个 被 积 
函数 要 大 于 1/2z. 1/2z 在 4 到 24 上 的 积分 就 是 3(log(24) 一 log(4)) = 5log2. 这 
个 结果 不 等 于 0, 因此 积分 值 确实 与 趋 近 于 无 穷 大 的 方式 有 关 ! 

为 了 避免 这 些 技术 上 的 问题 , 在 定义 均值 时 我 们 需要 考虑 更 多 内 容 . 只 确保 积 
分 的 存在 性 是 不 够 的 一 一 因为 这 是 个 反常 积分 , 所 以 必须 说 得 更 清楚 些 . 

最 后 , 我 们 给 出 两 点 说 明 . 首先 ， 由 于 概率 密度 函数 是 非 负 的 , 没 必要 把 它 
们 放 到 绝对 值 里 ， 其 次 , 我 们 也 不 需要 担心 方差 的 绝对 值 问题 , 因为 方差 是 (z 一 
Lz)?fx(z) 的 积分 , 总 是 非 负 的 . 具有 当 被 积 函 数 有 时 取 正 数 、 有 时 取 负 数 时 , 我 们 
才 需 要 考虑 一 些微 妙 的 收敛 问题 . 


地 
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9.4 联合 分 布 


在 很 多 问题 中 , 只 求 出 随机 变量 的 矩 (主要 是 均值 和 方差 ) 是 不 够 的 . 我 们 会 
经 常 处 理 随 机 变量 的 和 . 之 前 已 经 看 到 过 一 些 这 样 的 例子 . 第 一 个 例子 是 , 让 X 表 
示 抛 括 一 枚 均匀 便 币 3 次 后 出 现 正面 的 次 数 . 这 里 的 X 就 可 以 写成 每 次 抛掷 后 日 
现 正面 的 次 数 ( 即 Xi;) 之 和 , 也 就 是 X = Xi 十 Xz 十 X3. 季 运 的 是 , 这 个 理论 基本 
上 可 以 推广 . 我 们 不 考虑 下 面 这 种 最 一 般 的 情况 , 稍 后 会 给 出 一 些 注释 . 


联合 概率 密度 函数 : 设 Xi1, Xo,… ,Xn 都 是 连续 型 随机 变量 , 它们 的 概率 密度 函 
数 分 别 是 jx, jx，… , fx. 假设 每 个 X; 都 定义 在 及 (实数 集 ) 的 一 个 子 集 上 . 


上 上 


那么 , (Xi1,… ,Xn) 的 联合 概率 密度 函数 就 是 一 个 非 负 的 可 积 函 数 fx,.… ,x,, 满 
足 : 对 于 每 -个 恰当 的 集 名 SCRR, 均 有 
Prob((X1,... ,Xn,) € 5) = 2 | a (Ti) ,Cn) dvi den, 
并 且 
Ms 
EO ee 


我 们 把 fx, 称 为 X; 的 边缘 概率 密度 函数 , 可 以 通过 对 其 他 n 一 1 个 变量 求 积 儿 
来 得 到 
这 nn 个 随机 变量 Xi,…. ,X 相互 独立 , 当 且 仅 当 


fe (z1…: ,Zn)】 = 2 fxi(71):*: fx, (Tn). 
对 于 离散 型 随机 变量 , 只 需要 把 积分 替换 成 求 和 即 可 . 


里 然 我 们 经 常 期 望 每 个 随机 变量 都 独立 于 其 他 变量 , 但 事实 并 非 总 是 如 此 . 联 
合 概率 密度 函数 是 体现 随机 变量 之 间 依 赖 关 系 的 一 种 方法 , 它 能 给 出 给 定 n 元 组 
的 概率 . 

在 上 面 的 定义 中 , 为 了 便于 讨论 , 我 们 把 每 个 随机 变量 都 定义 在 实数 集 上 . 其 

实 , 我 们 可 以 很 容易 地 把 不 同 的 变量 定义 在 不 同 的 空间 中 . 重要 的 是 ， 我 们 可 以 对 
n a 

用 一 张 表格 来 展示 联合 概率 密度 函数 (尤其 是 , 对 于 离散 型 随机 变量 来 说 ) 是 种 
不 错 的 方法 . 我 们 考虑 抛掷 5 枚 均匀 硬币 的 情况 , 并 且 每 次 抛掷 都 是 独立 的 . X 表 
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示 前 3 次 掷 出 正面 的 次 数 , Y 表示 后 2 次 搓 出 正面 的 次 数 . 我 们 想 求 出 (X,Y) 的 联 
合 概率 密度 函数 . 注意 , (X,Y) 的 可 能 值 是 (m,n), 其 中 mm es {0,1,2,3}, me {0,1,2}. 
因为 每 次 抛掷 都 是 独立 的 , 所 以 “X = m 且 Y = mw2” 的 概率 就 等 于 X = m 的 概率 乘 
以 Y =n 的 概率 (其 中 , m e {0,1,2,3}, me {0,1,2}). 我 们 看 到 


ween- {be ee ne {0,1,2} 


表 9-2 展示 了 上 述 内 容 . 表 中 的 每 一 项 都 是 (X,Y) 等 于 (m,n) 的 概率 . 注意 ， 
第 1 个 数 是 和 的 值 , 第 2 个 数 是 了 的 值 . 如 果 把 某 一 行 的 概率 加 起 来 , 那 就 意味 
着 考察 的 是 当 了 取 遍 所 有 可 能 的 值 时 , (X,Y) 的 概率 . 这 恰好 是 X 的 边缘 概率 密 
度 ! 因此 , 如 果 想 求 出 各 的 边缘 概率 密度 , 只 需要 把 每 行 的 概率 都 加 起 来 . 同样 地 ， 
如 果 把 某 一 列 的 概率 加 起 来 , 那么 就 考察 了 X 的 所 有 可 能 取 值 , 这 样 就 得 到 了 Y 
的 边缘 概率 密度 . 
表 9-2 。 (和 X) 的 联合 概率 密度 函数 ，X 表示 独立 地 抛掷 5 枚 均匀 硬币 , 前 3 次 拉 出 

正面 的 次 数 ; Y 表示 后 2 次 掷 出 正面 的 次 数 


Prob(Y = 0) Prob(Y = 1) Prob(Y = 2) 
Prob(X = 0) 1/32 2/32 1/32 1/8 
Prob(X = 1) 3/32 6/32 3/32 3/8 
Prob(X = 2) 3/32 6/32 3/32 3/8 
Prob(X = 3) 1/32 2/32 1/32 1/8 
1/4 2/4 1/4 


我 们 可 以 验证 随机 变量 是 否 相 互 独立 ，( 最 好 是 独立 的 , 因为 我 们 对 匀 和 YY 
的 选取 是 独立 的 ! ) 对 于 所 有 的 mm 和 n, 我 们 必须 证 明 fx,y (m,n) = fx(m)fy(n). 
现在 必须 对 所 有 的 数 对 进行 验证 . 显然 , 我 们 只 需要 考察 当 m e {0,1,2,3} 且 n Ee 
{0, 1,2} 时 , 上 式 是 否 成 立 . 例如 , fxy(1,2) = 6/32, 而 且 fx(1)fy(2) = 3/8:2/4= 
6/32. 通过 验证 不 难看 出 , 对 于 剩 下 的 11 种 情况 , 上 式 仍 然 成 立 . 因此 , X 和 了 是 
相互 独立 的 . 

表 9-3 给 出 了 不 同 的 联合 概率 密度 函数 . 它 有 许多 有 趣 的 特性 , 与 表 9-2 的 例 
子 有 很 多 相似 之 处 . 

首先 , 每 一 项 都 是 非 负 的 , 并 且 所 有 项 的 和 是 1. 由 此 可 以 马上 看 出 , 把 每 一 列 
的 和 都 加 起 来 就 等 于 1. 同样 , 把 每 一 行 的 和 都 加 起 来 也 会 得 到 1. 为 什么 呢 ? 把 3 
个 列 和 加 起 来 就 相当 于 把 所 有 的 项 相 加 , 其 结果 当然 就 是 1; 行 和 也 是 如 此 . 因此 ， 
我 们 得 到 了 一 个 联合 概率 分 布 . 

注意 , UV 的 边缘 概率 密度 与 上 一 个 例子 中 X 的 边缘 概率 密度 是 一 样 的 , Y 的 
边缘 概率 密度 与 了 的 边缘 概率 密度 也 是 一 样 的 , 但 是 它们 的 联合 概率 密度 却 大 
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不 相同 . UV 和 Y 是 相互 独立 的 吗 ? 要 想 证 明 UV 和 Y 是 相互 独立 的 , 必须 证 明 
fuv (mn) = fu(m)fv(n) 对 所 有 的 (m,n) 均 成 立 . 但 是 , 如 果 想 说 明 它们 彼此 依 
赖 , 只 需要 找到 一 对 使 得 上 式 不 成 立 的 (m,n) 即 可 . 可 以 考察 下 面 这 两 对 : (m,n) = 
(0,2) 或 (3,0). 为 什么 要 考察 这 两 对 ? 这 两 对 的 联合 概率 密度 都 是 0, 但 任意 一 对 
的 fv 和 fy 均 不 为 0! 如 有 果 具 体 算 一 下 , 那么 有 


fov(0,2%) =0# 57 = fo(0)fv(2) 


表 9-3 (U,V) 的 联合 概率 密度 函数 , 其 中 U 表示 独立 地 抛掷 5 枚 均匀 硬币 时 前 3 次 
掷 出 正面 的 次 数 ，Y 表示 后 2 次 掷 出 正面 的 次 数 


Prob(V = 0) Prob(V = 1) Prob(V = 2) 
Prob(U = 0) 1/16 1/16 0/16 1/8 
Prob(U = 1) 2/16 3/16 2/16 3/8 
Prob(U = 2) 1/16 3/16 2/16 3/8 
Prob(U = 3) 0/16 1/16 1/16 1/8 
1/4 2/4 1/4 


虽然 它们 不 是 相互 独立 的 , 但 这 两 个 随机 变量 仍 有 一 些 很 好 的 性 质 . U 是 前 3 
次 掷 出 正面 的 次 数 , Y 是 后 2 次 掷 出 正面 的 次 数 , 但 现在 第 1 枚 和 第 4 枚 硬币 被 烙 
在 了 一 起 . 因此 , 这 2 枚 硬币 要 么 都 掷 出 正面 , 要 么 都 搬出 反面, 所 以 U 和 V 之 间 
有 明显 的 依赖 关系 ! 现在 , 我 们 只 有 16 种 可 能 的 结果 (前 3 枚 硬币 有 8 种 可 能 的 
结果 , 但 后 2 枚 硬币 只 有 2 种 可 能 的 结果 , 这 是 因为 第 4 枚 硬币 的 结果 已 经 被 确定 
了 , 而 第 5 枚 硬币 有 2 种 可 能 的 结果 ), 而 不 是 32 种 (前 3 枚 硬币 共有 8 种 可 能 的 
结果 , 后 2 枚 硬币 共有 4 种 可 能 的 结果 ) 
最 后 , 给 出 一 个 连续 型 的 联合 概率 密度 函数 设 


1/7n 若 码 上 + 好 和 1 
0 1， 其 他 . 


给 出 因子 1/x 是 因为 单位 


/ Jxr(tz,y)dzdy = 1, 
Z 一 一 co JYy=—o00 


这 就 是 引入 因子 1/7 的 原因 . 关于 这 一 点 , 我 们 有 个 非常 好 的 解释 : 在 单位 圆 中 随 
机 地 选 出 一 点 , 这 一 点 落 在 单位 圆 中 某 给 定 区 域 的 概率 就 等 于 该 区 域 的 面积 与 单位 
圆 的 面积 之 比 . 

这 里 有 两 个 很 好 的 问题 : X 和 了 的 边缘 概率 密度 分 别 是 多 少 ? 它们 是 否 相互 
独立 ?我 们 计算 X 的 边缘 概率 密度 (Y 的 边缘 概率 密度 与 之 类 似 ). 如 果 z 买 [一 1 也， 


1 


的 面积 是 x. 记 住 , 我 们 需要 
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那么 fx(zx) = 0, 所 以 不 妨 设 z € [1,1]. 现在 对 所 有 的 y 积分 . 具有 当 z+ 她 <1 
时 , 被 积 函 数 才 不 为 0。 又 因为 x 是 固定 值 , 所 以 只 需要 考察 y 在 -V1 一 x? 到 
V1 一 X22 上 的 积分 . 于 是 , 对 于 任意 一 个 ze [1,1], 均 有 


V1 一 Z2 1 2 
fx(7) = 元 dy 2 元 VI 一 2 
y 


A ep 


当 x 取 其 他 值 时 , fx(z) = 0. 
作为 检验 , 看 看 这 个 函数 的 积分 是 否 为 1. 我 们 有 


Oo 1 2 4 1 
jx(z)dz = ' iV 1— zx2dx = | V1— x2dz, 
3 本 | 0 


现在 使 用 三 角 换 元 法 . (已 经 提醒 过 你 , 要 掌握 住 积分 技巧 ! ) 令 x = sin9, 那么 
dz = cos0d0, V1 -2 = V1 一 sin?0 = cos9 (不 需要 担心 负 号 一 一 这 就 是 把 前 面 
的 积分 改写 成 从 0 到 1 上 积分 的 原因 ), 并 且 在 0 和 1 之 间 取 值 的 x 就 变 成 了 在 0 
和 x/2 之 间 取 值 的 0. 于 是 


oOe 4 /2 4 /2 
- fx(z)dx = /| cos0 .cosb0dq0 = /| cos2 9d0. 
一 co To To 


现在 对 余弦 的 平方 求 积分 . 我 们 既 可 以 利用 它 的 原 函 数 39 十 sin(29), 也 可 以 由 对 
称 性 看 出 , 这 个 积分 就 是 从 0 到 2x 上 积分 的 1/4. 第 一 种 方法 留 给 你 自己 完成 , 我 
会 用 第 二 种 方法 计算 , 因为 这 展现 了 很 好 的 对 称 性 . 
首先 回顾 一 个 有 用 的 结果 : cos(9) = sin(9 十 引 ). 那么 , cos20 在 整个 区 域 上 ( 即 
从 0 到 27) 的 积分 就 等 于 sin2 0 在 该 区 域 上 的 积分 . 接 下 来 , 我 们 将 利用 这 个 结果 
给 出 关于 “fx 的 积分 等 于 1” 的 快速 证 明 . 通常 情况 下 , 计算 整个 区 域 上 的 积分 要 
比 计算 某 个 子 集 上 的 积分 更 容易 些 , 因为 可 以 利用 对 称 性 . 当 计算 第 14 章 中 高 斯 
密度 的 正规 化 常数 时 , 我 们 会 看 到 更 多 这 样 的 例子 . 
由 对 称 性 可 知 


/2 1 2 1 27 nx/2 
"| cos2 0d0 = i/ cos2 0d0 = i/ sin2 oa0= [ sin2 0d0. 
0 4 4.o 0 
过 简单 的 代数 运算 , 可 以 看 到 


/2 1 2 1 2 A 
站 cos2 0d0 = 3/ (cos20 + sin? 0)d0 = 3/ 1d0 = 一 . 
0 8 .ho 8 .Jo 4 


Ea 


最 后 , 把 上 述 结果 带 回 原 式 , 就 得 到 了 


你 fx(7)dz = 
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虽然 这 不 是 一 个 证 明 , 但 因为 fx 的 积分 等 于 1, 所 以 我 们 确信 在 计算 fx 的 过 程 中 
没有 出 现任 何 代 数 错 误 . 
同样 , 也 可 以 求 出 Y 的 边缘 概率 密度 函数 : 
2/xnVi—y 若 ye |[-1,1] 
fy(y) Ga | 
0 其 他 . 
现在 考察 独立 性 ， fx,y(x,y) = fx(7)fy(y) 是 否 成 立 ? 不 成 立 ! 通过 考察 
(4/5,4/5), 我 们 能 容易 地 看 出 这 一 点 ，fxy(4/5,4/5) = 0 (因为 这 一 点 在 单位 区 
之 外 ), 但 是 fx(4/5) = fy(4/5) = 3/5. 
实际 上 不 需要 这 么 麻烦 . 如 果 x 接近 1, 那么 y 的 取 值 就 会 受到 严重 限制 , 这 
样 就 可 以 “看 出 ”X 和 YY 之 间 的 依赖 关系 . 


9.5 ”期 望 的 线性 性 质 


本 节 旨 在 证 明 期 望 的 一 个 最 重要 且 最 有 用 的 事实 : 期 望 是 线性 的 ! 这 个 事实 
有 深远 的 影响 . 我 们 将 不 断 看 到 , 许多 看 起 来 毫 无 希望 的 问题 可 以 很 容易 地 利用 
性 性 质 来 解决 . 下 面 这 个 定理 是 我 们 的 主要 结果 . 

定理 9.5.1 (期 望 的 线性 性 质 ) 设 Xi， … ,总 是 随机 变量 , 并 设 g1,.… ,gs 是 


满足 下 列 条 件 的 函数 : 正 [|gi(CXi) 存在 且 有 限 . 令 a1,… ,an 表示 任意 实数 . 那 
么 


有 具 
线 


Slagi (Xi) 十 :十 angn(Xn)] = al 下 [gl( Xi)] + + anElgn (Xn)]. 


注意 , 随机 变量 不 一 定 是 相互 独立 的 . 另外 , 如 果 gi(Xi;) = c (这 里 的 c 是 固定 常 
数 ), 那么 Elgi(Xi)] = <. 


用 文字 来 叙述 , 上 面 的 意思 是 “和 的 期 望 等 于 期 望 的 和 ”. 正如 之 前 所 承诺 的 ， 
在 后 面 几 章 中 , 我 们 将 看 到 其 深远 影响 . 在 开始 论证 之 前 , 我 们 简单 地 说 明 绝对 值 
的 期 望 是 有 限 的 这 个 技术 性 假设 . 在 数学 中 , 有 些 量 是 无 定义 的 , 比如 co : 0, 0/0， 
co/co 和 co - co. 这 个 假设 是 为 了 避免 后 面 这 些 情 况 . 我 们 希望 能 自由 地 交换 积 4 
次 序 , 而 不 必 担 心 积分 的 存在 性 问题 . 在 这 个 假设 下 , 一 旦 需要 交换 积分 次 序 , 就 可 
以 使 用 富 比 尼 定 理 . 下 面 会 看 到 这 一 点 是 非常 有 用 的 . 

下 面 的 证 明 有 点 长 ,而 且 有 些 地 方 具 有 一 定 的 技巧 性 ， 第 一 遍 只 要 略 读 就 好 
了 , 但 有 必要 仔细 思考 . 记 住 , 只 看 一 遍 就 行 了 . 一 旦 证 明了 这 个 定理 , 就 可 以 使 用 
期 望 的 线性 性 质 . 我 们 再 也 不 用 考虑 这 里 的 论证 细节 了 ! 从 某 种 意义 上 说 , 这 和 我 
门 在 微 积 分 中 证 明 的 结果 非常 相似 . 在 求 出 像 z” 或 sin xz 这 类 函数 的 导数 之 后 , 就 
可 以 自由 地 使 用 这 些 导 数 了 . 


DH 
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定理 9.5 


似 地 论证 . 另外 ， 
于 离散 型 随机 变量 . 

作为 热身 , 我 们 看 看 X2 = Xi 的 性 
称 它 为 X. 我 们 要 算 的 是 


.1 的 简要 证 明 : 我 们 只 考察 n = 2 的 情形 , 一 般 情况 下 的 结果 可 以 类 


三 


腿 设 随机 变 


这 不 算 大 
是 线性 运算 ( 
如 果 Xl1 


含 一 个 变量 , 所 以 它 就 是 个 一 重 积 分 . 这 一 发 现 提供 了 证 明 思 路 : 可 以 对 其 中 一 个 
简化 成 两 个 不 同 的 一 重 积分 之 和 (如 果 有 n 个 变量 


saig1(X) + a2g92(X)]. 


量 是 连续 的 并 使 用 积分 符 


一 Q 


和 


和 


变量 求 积分 , 并 将 二 重 积分 


有 i 
就 必须 把 n 习 


EE 积分 简化 成 若干 个 一 重 积 分 之 和 ) 


. 当然 , 同样 的 论证 也 适用 


4 况 . 因为 现在 只 有 一 个 随机 变量 , 所 以 不 妨 
只 利用 期 望 的 定义 , 就 看 到 了 


slaig1(X) + a292(X)| = 站 (aigi(zZ) + azga2(Z)) fx (x)dz 
fanaaart 人 ooD7xlodz 


人 we DR 

[gn (X)] + oaE [92(X)]. 

并 ， 此 外 , 证 明 过 程 也 说 明了 为 什么 结果 是 正确 的 : 求 和 与 求 积分 都 
的 积分 等 于 积分 的 和 )， 而 期 望 似乎 继承 了 
和 是 两 个 不 同 的 随机 变量 , 那么 情况 会 更 复杂 
在 有 一 个 联合 概率 密度 函数 .我 们 会 得 到 一 个 二 重 积分 由 于 每 个 


这 个 线性 性 质 . 
些 . 问题 在 于 现 
[9i( Xi)] 只 包 


同样 , 我 们 只 考察 有 两 个 随机 变量 的 情况 ， 


细节 留 给 你 自己 来 补充 是 个 不 错 的 主意 )， 为 了 简化 计算 , 不 妨 设 ai 
gi(Xi) = Xi， 通过 仔细 研读 整个 证 明 并 做 
我 喜欢 简洁 明了 , 所 以 这 里 的 思路 不 会 被 符号 掩盖 . 


于 是 , 设 fx,,xs 是 Xi 和 Xo 的 联合 概率 密度 函数 (对 联合 概率 密度 函 
顾 ， 请 参阅 9.4 节 ). 令 和 = 及 1 十 及 2， 目标 是 证 


那 


般 必 


4 况 可 以 类 似 地 证 明 (把 这 些 


8 一些 调 整 , 你 可 以 处 理 更 一 般 


Q2 一 1 且 
的 情况 . 


数 的 回 


明 


| 区] = 


| X1] 十 正 [X2], 而 出 发 点 


[|X] 


/aodz 


我 们 ， 


必须 从 这 一 点 着 手 . 


应 该 是 我 们 天 


的 定义 
更 进一步 , 我 


不 同 变量 


始 的 ). 我 们 必须 从 


定 要 始终 关注 定义 . 这 正 是 定义 期 望 值 的 方法 , 所 以 也 


F 始 的 地 方 . 这 类 似 于 微 积分 中 各 种 微分 法 则 的 证 明 (它们 都 是 从 导数 


随机 变量 X 的 一 个 积分 


(或 一 个 和 ) 开始 . 当然 , 为 了 


们 想 把 上 述 积分 替换 成 关于 zi 和 zs 的 积分 . 最 初 会 得 到 二 重 积分 ， 


个 变量 求 积 分 . 


但 在 对 某 个 变量 求 积分 之 后 , 二 重 积分 就 可 以 替换 成 一 重 积分 . 由 于 存在 很 多 关于 
的 积分 , 所 以 我 们 会 在 积分 限 上 写 出 变量 名 , 这 样 就 能 清楚 地 知道 是 对 哪 
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现在 , 要 把 关于 z 的 积分 替换 成 关于 zl 和 za 的 积分 . 该 怎么 做 呢 ? 为 了 求 出 


一 2 的 概率 , 对 


zi 求 积 分 , 其 中 za = z= zi. 于 是 


[|X] = 人 , zx: Pr(X = 2)dz 


一 | 化 I/ fxi,xs (X17 — ZT1)dz1 dz 
2 一 一 Co 21 一 一 Co 


Ce Co 
. / Tfxi,xo (TX1,T — TX1)drdz1. 
21 一 一 co J X=—o00 


现在 替换 变量 , 并 让 za = x 一 zi (所 以 z= zl + z2). 在 接 下 来 的 计算 中 , 我 们 的 目 


标 是 求 出 关于 一 个 随机 变量 的 积分 , 从 而 把 联合 概率 密度 转化 成 边缘 概率 密度 . 为 
什么 要 这 样 做 ? 这 是 因为 , 最 终 的 积分 值 就 等 于 一 个 随机 变量 的 期 望 . 于 是 就 得 到 


了 


| / (Z1 十 Za2)jjx xs(Zl,Z2)dzodzZ1 
TX1 三 一 O00 TX2 二 一 O00 


-人 万 Z1jf xxo(Z1Z2)dz2dzZ1 
TX1 三 一 O00 TX2 二 一 O00 
十 小、 人 To f x1, Xa (ZX1, T2)dr2dz1 
TX1 三 一 O00 TX2 二 一 O00 
人 21 Bh: f x1,X2 (ema)da| dz1 
TX1 三 一 O00 人 2 三 一 OO 
十 大 2Z2 广 Peerzadal| dz1 
TX2 二 一 O00 Tl 三 一 O00 


=] mfale)drt | rT2fxs(T2)dr1 


[X11 | 让 |X2>|. 


这 样 就 完成 了 n= 2 这 种 特殊 情形 下 的 证 明 , 一 般 情 况 可 以 类 似 地 论证 . 


现在 上 只 剩 下 证 


明 “ 如 果 gi(Xi) = e 那么 Elgi(Xi)] = c” 了 . 利用 概率 密度 函数 


的 定义 , 可 以 马上 


得 出 该 结论 


sgi(Xi)] = 


qd= | cfx, (zi)dzx; = < fx (rd = C= 


这 样 就 完成 了 定型 


对 于 上 面 的 证 明 , 有 必要 看 看 没有 用 到 哪些 条 件 . 通常 情况 下 , 我 们 会 关心 在 


的 证 明 . 


证 明 中 使 用 了 什么 , 但 这 个 证 明 没有 用 到 的 东西 也 同样 重要 . 在 证 明 中 , 我 们 没有 
假设 随机 变量 是 相互 独立 的 . 这 一 点 非常 棒 , 意味 着 即使 随机 变量 彼此 依赖 , 结果 
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仍然 成 立 ! 最 后 也 不 必 寓 力 地 写 下 联合 概率 密度 函数 , 利 
解决 问题 . 接 下 来 给 4 


8 几 个 关键 的 结果 . 


期 望 的 线性 性 质 就 可 以 


引 理 9.5.2 
是 任意 两 个 


设 X 是 一 个 随机 变量 , 它 的 均值 为 WUx, 方差 为 o&. 如 果 a 和 


玖 ,那么 随机 变量 科 =aXT+Tb 有 下 列 结果 


uy=akx+b 和 oy = a2o9. 


证 明 : 


虽 


以 通 ; 


五 


过 


顾 相 关 定义 来 证 


明 


上 面 的 结论 , 但 利用 定理 9.5.1 来 证 


明 


更 容易 (而 加 有 趣 ). 先 来 考察 均值 . 因为 jx = E[X] 和 jy = EE[ 了 站, 所 以 
[Y= ElaX+b] = aEIXI+bEI = ayx +b, 
我 们 看 到 了 利用 定理 9.5.1 去 证 明 会 带 来 哪些 好 处 : 现在 不 再 需要 把 概率 密度 函数 
明确 地 写 出 来 ! 
我 们 再 看 一 下 方差 .和 往常 一 样 , 从 定义 着 手 . 幸运 的 是 , 方差 的 定义 涉及 期 
望 , 这 意味 着 可 以 再 次 使 用 定理 9.5.1! 
oY = El(Y — yy)’] 
= |[((aX +b) — (anx +b))" | 
=E[(axX —anx)’| 
=Elaz(X 一 px) = a2E[(X — px)] = a2o%. 


引 理 9.5.2 的 陈述 是 非常 合理 的 . 如 果 把 随机 变量 缩放 a 倍 , 那么 均值 也 会 被 


;党 


缩放 a 倍 是 有 


的 公式 . 


道 
旧 值 的 10 倍 . 另外 , 这 也 会 使 得 标准 差 缩放 |a 
是 负数 ), 而 这 又 进一步 导致 方差 缩放 了 a? 倍 ( 
上 一 个 p, 那么 均值 也 会 加 上 一 个 b, 但 方差 没有 任何 变化 ( 当 所 有 量 都 发 生 相 同 的 
变化 时 , 随机 变量 的 取 值 在 均值 附近 的 波动 避 

现在 , 我 们 给 4 


理 的 . 我 们 可 以 把 它 想象 成 从 分 米 到 


倍 (这 里 使 


关于 期 望 的 线性 性 质 的 最 后 


< 
a2 总 是 


厘米 的 变化 , 得 到 的 新 值 会 是 
绝对 值 是 因为 a 可 能 
E 负 的 ). 如 果 把 随机 变量 加 


4 况 就 不 会 有 任何 改变 ). 


引 


折 


个 结果 , 即 


个 更 


简单 的 求 方差 


引 理 9.5.3 


Var(X) 


设 X 是 一 个 随机 变量 , 那么 


|[X2] 一 


[和 ] 


这 个 引 理 和 


集中 在 某 个 点 上 , 否则 方差 就 是 正 的 . 等 式 


4 诉 我 们 , 次 序 真 的 很 


E 要 . 方差 是 非 负 的 . 事实 上 , 除非 所 有 概率 都 


-Yu E 


X2 的 


期 望 值 减 去 X 期 望 值 的 


日 并 
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平 广 . 所 以 , 这 个 结果 通常 是 正 的 , 它 说 明了 “ 先 平方 , 后 期 望 ”与 “先期 望 , 后 平 
方 ” 是 不 一 样 的 . 
证 明 : 由 于 期 望 具有 线性 性 质 , 所 以 这 个 证 明 应 该 会 让 人 感到 非常 愉快 . 与 之 
前 一 样 , 从 相关 定义 开始 (在 本 例 中 是 方差 的 定义 ), 并 做 一 些 代 数 运 算 . 在 下 面 的 
分 析 中 , 对 于 任意 的 随机 变量 了 以 及 任意 常数 a 和 b, 都 能 利用 ElaY] = aE[Y] 和 
[b] = b. 于 是 有 
Var(X) = E[(X — px) 
= E[X? — 2uxX + nx] 
= E[X”] — El2ux X] + EluxX] 
= ELX] — 2uxE[X] + pe 
= E[X®] — 2ux ux + nx 
= EX — p= ELX3 — ELX]?, 
结论 得 证 . 


当 你 可 以 选择 如 何 计算 时 , 每 一 种 计算 方法 所 具备 的 优势 都 值得 思考 . 这 个 公 


式 是 不 是 比 定义 更 好 ? 它 的 优点 和 缺点 分 别 是 什么 ? 

这 恰巧 是 一 个 很 好 的 公式 . 在 已 知 一 阶 算 和 二 阶 窍 的 前 提 下 , 我 们 能 利用 这 个 
公式 求 出 二 阶 中 心 矩 ( 即 方差 ). 不 管 从 理论 上 讲 , 还 是 从 计算 方面 上 讲 ， 在 给 定数 
据 的 情况 下 , 计算 了 LIX2] 或 E[X] 要 比 先 求 出 均值 、 然 后 从 所 有 值 中 减 去 均值 、 了 
对 得 到 的 新 值 进行 平方 等 , 容易 很 多 . 注意 , 直接 利用 定义 的 方 i 法 会 涉及 更 多 代数 
运算 一 一 虽然 平方 运算 的 数量 没有 变化 , 但 存在 更 多 减法 运算 . 这 意味 着 我 们 的 
新 公式 是 有 价值 的 . 

当然 , 借助 现代 计算 机 的 力量 , 减法 不 再 是 单调 乏味 的 苦 差事 , 但 是 运算 越 多 ， 
出 现 舍 入 误差 和 其 他 错误 的 概率 就 越 大 . 这 个 新 公式 会 更 简单 , 也 更 有 用 . 


利用 这 个 公式 来 计算 抛掷 一 枚 均匀 仍 子 所 得 到 的 数字 的 方差 . 设 X 是 掷 出 的 
数字 , 那么 X 的 值 是 1、2、3、4、5 或 6 的 概率 均 为 1/6, 取 其 他 数字 的 概率 等 于 
0. X 的 均值 就 是 

ee nk | wa 
X 的 二 阶 算是 
Bo | 92. | /2. ,rz2.1 21 _ 91 
| -3 -4 es 
因此 , 其 方差 为 
Var(X) = 全 = ~ 2.92 
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与 下 列 计算 过 程 


了 


1 
3 


概念 会 有 一 个 定义 , 但 我 们 在 实 


了 一 个 不 同 的 公式 . 如 果 你 学 过 多 元 微 


的 例子 : 用 极限 定义 的 方向 导数 与 用 梯度 定义 的 内 积 ; 


Var(X) = (1 5) 3.5)? 
相 比 , 新 公式 的 代数 运算 更 简洁. 
这 种 情况 在 数学 中 是 很 普遍 的 . 通常 情况 下 ， 
践 中 发 现 该 定义 用 起 来 并 不 方便 , 进而 采用 
积分 , 那么 这 里 有 一 个 很 好 
行 比较 , 后 者 会 更 加 实用 . 


9.6 ”均值 和 方差 的 性 质 
们 先 陈述 并 证 明 一 个 非常 有 用 的 事实 . 


完 矩 之 前 , 我 


定理 9.6.1 


一 种 特别 重要 的 情况 是 


一 AX) 


如 果 和 和 了 是 相互 独立 的 随机 变量 , 那么 


[XY] = EIXIEIY]. 


(Y — ypY)] = EIX ~ 1x] 


oY 人 LY] 一 0. 


证 明 : 遗憾 的 是 , 这 个 证 明 无 法 马 


处 理 的 是 和 , 而 这 里 去 


I 是 乘积 . 这 意味 着 我 们 必须 
假设 随机 变量 是 连续 的 , 它们 的 联合 概率 密度 函数 是 fx,y. 于 是 


[XY|= 加 人 ZU xyr(Z,y)dzdy. 


上 从 定理 9.5.1 中 得 到 . 问题 在 于 , 定理 9.5.1 


相 


真正 做 到 严格 , 应 该 先 通 


A 


此 扒 


并 


重 积分 . 这 是 个 标准 


来 定义 


oo 


过 符号 


2] 


以 现在 直接 跳 到 二 重 积分 # 


我 们 要 利用 “X 和 了 


继续 往 下 看 . 


是 


Y = X, 那么 在 这 种 情况 下 


, E[X]E[Y] = 0, 但 


口 


到 期 望 的 定义 . 为 了 更 加 明确 ， 


个 随机 变量 2 = XY, 从 而 有 


人 zfz(z)dz, 
的 论证 过 程 , 我 们 已 经 做 过 很 多 次 了 , 所 


相互 独立 的 ”这 个 假设 .如果 X 的 均值 是 0, 并 且 
7[X2 


是 非 负 的 (几乎 


肯定 是 正 的 ). 


旦 得 到 了 某 些 信 ， 
到 的 是 , 对 于 两 个 
概率 密度 函数 之 积 . 就 这 个 


昌 , 你 就 应 该 问 


问 自 


问题 而 


己 , 得 到 了 哪些 事实 、 定 理 和 结果 . 现在 能 想 
日 互 独立 的 随机 变量 , 它们 的 联合 概率 密度 函数 就 等 于 它们 边缘 


fx,y lz, y) = fx(z)fy(y). 


9.6 均 


值 和 方差 的 性 质 ”283 


把 上 面 这 个 式 子 应 上 


于 二 午 积 分 


日 


i Tfx(r)dr .| 


oo 


一 一 CO 


o[XY] 就 得 到 了 


[XY|= | i , ryfx(r)fy (ydydz 


yfy (vy)dy 


二] 


[7]. 


X 和 YY 是 相互 独立 的 , 那么 匀 一 jx 和 YY 一 jy 也 是 相互 独立 的 . 这 些 


个 
只 是 简单 的 变换 . 注意 , 这 两 个 随机 变量 的 期 望 值 都 是 0. 记 住 , 一 个 常数 的 期 望 值 
仍 是 这 个 常数 , 于 是 
(X—pux|= EX -Ekx|= kx — Hx=0. 

通过 替换 就 能 得 到 这 个 重要 的 特殊 情形 . 

虽然 所 有 的 矩 都 很 重要 , 但 有 些 和 个 要 比 其 他 逢 更 重要 . 对 于 所 有 分 布 而 言 , 前 
两 个 和 矩 ( 即 均值 和 方差 ) 是 目前 已 知 的 最 关键 的 两 个 矩 . 根据 均值 和 方差 , 我 们 可 以 
知道 期 望 结 果 是 什么 , 以 及 波动 程度 如 何 . 这 两 个 概念 有 一 些 很 好 的 性 质 . 
定理 9.6.2 (随机 变量 之 和 的 均值 与 方差 ) 设 Xi,… ,Xi 是 n 个 随机 变量 , 它 
们 的 均值 是 jxi,… ,Lx, 方差 是 o3,… ,0% .如果 义 =X 十 … 十 Xn, 那么 


2 


2 
Ox 三 0 


X1 


是 02)， 那么 


HU 一 mL 且 co 一 ma 


Hx = Hxi 十 :十 HAXn: 
如 果 随 机 变量 是 相互 独立 的 , 那么 还 能 得 到 
十 … 十 OX， 或 Var(X)=Var(XI) 十 十 Var(Xn). 
如 果 这 些 随机 变量 是 独立 同 分 布 的 (因此 , 每 个 随机 变量 的 均值 都 是 j, 方差 都 


2 


我 


门 一 次 又 一 次 地 看 到 , 每 当 遇 到 一 个 定 下 


有 多 重要 . 为 了 保 i 
样 ! 现在 想 一 下 , 表 
以 及 和 和 一 X 的 
这 个 随机 变量 恒 等 于 0， 
设 X 的 方差 是 正 的 ) 


外 


两 个 


随机 变量 的 联系 最 紧密 . 和 
居 系 最 紧密 . 我 们 看 一 下 第 二 利 
因此 其 方差 也 是 0， 此 时 , 上 述 定 型 


现在 我 们 来 看 看 训 


容 也 不 要 担心 . 关键 思路 是 , 和 的 


lL 


EE 时, 首先 要 做 的 就 是 看 看 这 些 假设 
FE 方 差 公式 的 成 立 , 随机 变量 必须 相互 独立 吗 ? 没 错 , 绝对 是 这 


微 思 考 


下 就 能 想到 和 和 XX， 


情况 . 讨论 X + (-X) 并 不 困难 . 


是 不 成 立 的 (当然 , 假 


E 明 . 这 有 一 定 的 技巧 性 , 所 以 如 果 你 是 第 一 次 略 读 这 


定理 9.6.2 的 简要 


期 望 值 就 等 


期 望 值 之 和 . 


部 分 内 


证 明 : 我 们 只 考察 涉及 两 个 随机 变量 的 情形 , 一 般 情况 可 以 


类 似 地 证 明 (把 这 些 细节 留 给 你 自己 来 补充 是 个 不 错 的 主意 ). 另外 , 假设 Xi 和 X。 


= 


续 型 随机 变 


对 于 离散 型 的 情况 


口 


，/、\ 


要 把 求 积分 


替换 成 求 和 就 行 了 . 
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定理 的 第 一 部 分 就 是 定理 9.5.1 的 特殊 情形 , 即 每 个 wu =1 并 且 每 个 g;(Xi) = 
人 
没 错 , 这 表明 了 和 的 期 望 值 是 期 望 值 之 和 . 那么 方差 呢 ? 不 难看 出 , 事情 会 变 得 
更 加 复杂 . 我 们 将 给 出 两 种 证 明 方 法 . 第 一 种 是 “巧妙 ”的 证 明 , 即 利用 期 望 的 线 
性 性 质 (参见 定理 9.5.1) 来 证 明 , 此 时 不 必 明 确 地 写 出 积分 . 于 是 
A 2 
ox = El((X— x)] 


|(CG + Xa) — (px + 


[C1 — ps) + (Xa — pr)"| 


Lxi)(X2 — Lxs) + (X2 — Mxs)’|. 


[CX2 — xa) 


=E[(X1— px) +2(X1 
利用 期 望 的 线性 性 质 , 可 以 把 和 的 期 望 改写 成 期 望 的 和 , 即 
ox =E[(Xi— ux) |] +ER(X px)(X2 — Hxs)| + 
= ox, +2E[(X1 — x)(X2 — xs)] + ox,. 


通常 , 我 们 会 在 
随机 变量 是 相互 独立 的 , 那么 乘积 
假设 随机 变量 是 相互 独立 的 . 这 正 是 我 们 要 处 型 


这 一 点 被 卡 住 , 因为 乘积 的 期 望 不 一 定 等 于 
的 期 望 就 是 期 望 的 乘积 ! 现在 就 能 看 出 为 什么 要 


项 等 于 0. 因此 


这 样 就 完成 了 证 明 (我 们 可 以 马上 推出 当 所 有 随机 变量 的 均 


结果 ). 


同样 地 , 我 们 来 探讨 一 下 从 这 个 新 命题 中 可 以 推出 哪些 结果 . 我 们 知道 


定 是 非 负 的 , 因 


ox 


oe 2 
= Ox + Ox,: 


的 交叉 项 . 


引 理 


此 上 面 X 的 方差 


平方 , 这 很 好 地 确保 了 方差 的 非 负 怕 


变 成 4 倍 (标准 差 也 会 翻 倍 ). 可 以 把 这 看 成 改变 了 测量 的 尺度 . 


得 到 了 很 好 地 体现 . 如 
而 标准 差 也 会 翻 倍 ). 这 显然 不 是 一 个 证 明 , 但 不 难看 出 


定 是 非 负 的 . 注意 , 关 


果 让 所 有 的 i 都 翻 倍 , 那么 和 尼 


2 
于 o% 


的 公式 只 涉及 mw 


重要 的 结果 应 该 被 多 次 证 明 . 现在 给 出 定理 9.6.2 上 


都 值得 一 看 ， 
我 喜欢 利 上 
舒服 . 


定理 9.6.2 的 (再 次 ) 证 明 : 根据 方差 的 定义 , 我 们 看 到 


上 看 , 它 和 之 前 的 证 明 是 一 样 的 , 唯 


因为 有 些 人 更 习惯 于 茶 一 种 代数 方法 ， 
期 望 的 “巧妙 证明, 但 有 时 把 积分 明确 


= 


pa . , (i) (et 
1 三 一 CO 2 三 一 CO 


期 望 的 乘积 . 但 是 , 如 


h. 就 个 人 而 言 


二 
百 ， 


四 
个 


9.5.2 可 知 , 这 一 


值 和 方差 都 相等 时 的 


方差 一 


的 


FE. 另外 , 如 果 把 所 有 w 都 翻 倍 , 那么 方差 就 会 
这 种 规律 在 公式 中 
有 实 变 成 了 4 倍 (从 
这 个 结果 是 合理 的 . 
的 另 一 种 说 
的 区 别 在 于 如 何 进行 代数 运算 . 这 两 种 证 
而 不 是 另外 一 利 
地 写 出 来 确 


E 明 方法 . 从 本 质 


明 


上 实 会 让 我 感到 更 加 
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对 其 中 一 部 分 被 积 函 数 进 行 改写 


((z1 + x2) 一 (xc + pxa)” = (v1— pxi) + (x2 一 Ne) 


= (x1 ux) | 2(z1 HAxi)(za 一 AUxs) 十 (za — pxs). 


把 它 代 入 上 面 的 式 子 , 就 得 到 了 关于 o3% 的 三 个 积分 . 两 个 积分 很 容易 计算 , 但 最 
后 一 个 相当 困难 . 现在 得 到 了 


Ce Co 
ox = 1 / (x1 — Mxi) fxi,xa(T1, 72)dr2dz1 
人 1 三 一 OO TX2 二 一 O00 


十 | / 2(Z1 — Wxi)(T2 — Wx) fxi, Xa(T1, T2)dr2d71 
1 三 一 CO 2 三 一 CO 


Ce Ce 
十 1/ 由 (za 一 AN) (zza2)dzodzl， 
1 三 一 CO TX2 二 一 O00 


对 于 第 一 个 式 子 , 我 们 先 求 za 的 积分 . 这 样 就 把 zz 积 了 出 来 , 剩 下 的 就 是 Xi 的 
边缘 概率 . 类 似 地 , 对 于 第 三 个 式 子 , 我 们 可 以 交换 积分 次 序 , 先 求 zi 的 积分 , 进而 
得 到 了 X 的 边缘 概率 . 最 终 的 积分 就 是 X! 和 X2 的 方差 : 


0 = 下 ee 
TX1 三 一 O00 


十 人 2(2Z1 — Hx)(T2 一 xs)jxixo(ZlZ2)dz2dzl 
21 一 一 co J Zao 一 一 co 


+ 人 -peppeleadm 


Ce Co 
-t+2] (Z1 — Hxi)(T2 — Hxa)fxi,xa(T1, T2)dr2dx1. 
TX1 三 一 O00 X2 二 一 O00 


现在 只 需要 证 明 最 后 一 个 积分 等 于 0. 因为 Xi 和 Xs 是 相互 独立 的 , 所 以 fix,x,(z1 
ZT2) = fx (z1)fxs(X2). 这 个 积分 就 变 成 了 


[palm ea) f(a)de 


[Xi 一 人] | X2 — Mx] 二 0, 


结论 得 证 . 
应 用 : 令 人 惊奇 的 是 , 定理 9.6.2 在 设计 最 佳 投资 组 合 中 发 挥 了 重要 作用 ! 在 
这 里 , 我 们 简单 地 说 明 一 下 它 是 如 何 起 作用 的 . 假设 有 两 只 收益 可 变 的 股票 . X 和 
Xo 分 别 表示 第 一 只 股票 和 第 三 只 股票 的 收益 . 为 简单 起 见 , 不 妨 设 它们 每 股 的 价 
值 都 是 1 美元 , 两 只 股票 的 平均 收益 都 是 3 美元 , 而 它们 的 方差 都 是 2 美元 . 我 们 
的 目标 是 建立 一 个 收益 尽 可 能 多 且 风 险 尽 可 能 少 的 投资 组 合 . 如 果 这 两 只 股票 是 相 
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互 独立 的 , 那么 我 们 可 以 通过 同时 投 


[95] = ElwXi+ (lw 
二 ww: $3 十 (1 一 w) 


如 果 把 其 中 的 w 美元 用 来 购买 第 一 


资 两 种 股票 来 减少 风险 ! 


)X?] 一 也 | Xi + (1 ow) 
“$3 = $3. 


注意 , w 是 什么 并 不 重要 . 我 们 的 预期 收益 始终 是 3 美元 . 


那么 方差 是 多 少 呢 ? 这 个 问题 更 
且 每 个 变量 的 方差 都 是 2, 因此 


由 于 两 只 股票 的 价格 相同 , 整个 数学 过 程 就 被 简化 了 . 假设 我 们 一 共 投 资 1 美 
元 ， 只 股票 , 那么 剩 下 的 1- w 美元 就 可 以 用 来 
购买 第 二 只 股票 . 我 们 把 这 个 过 程 记 作 5 = wXi + (1 一 w)X2. 先 来 计算 期 望 值 : 


|X] 


有 趣 . 因为 这 两 个 随机 变量 是 相互 独立 的 , 并 


Var(S) = Var(wXi 十 ( 工 一 岂 )X2) 


= W2Var 


一 (2 十 


(X1) + (1 — w)* Var(X2) 
(一 四) :2. 


注意 , 投资 的 方差 取决 于 w. 当 w 等 于 多 少时 , 方差 可 以 取 到 最 小 值 ? 利用 微 积 4 


(甚至 绘图 ), 我 们 看 到 w = 1/2. 那么 , 这 个 方差 就 是 (1/4+ 1/4) .2 = 1 
组 合 投资 的 方差 是 1, 它 是 原来 投资 的 方差 的 一 半 . 现在 的 情况 是 , 我 们 能 够 得 
到 同样 的 收益 , 但 风险 显著 降低 了 (因为 方差 较 小 , 所 以 


8 现 大 波动 的 概率 也 较 小 ). 


当然 , 这 也 意味 着 我 们 能 得 到 多 于 3 美元 收益 的 概率 会 更 小 , 但 大 多 数 人 都 很 乐意 
做 这 个 交易 (放弃 可 能 获得 更 高 收益 的 机 会 , 以 减 小 赔钱 的 概率 ). 这 只 是 这 些 概念 


能 够 发 挥 作用 的 众多 例子 中 的 一 个 . 
最 后 , 我 们 再 给 出 一 个 符号 . 


aN 


X= XI 二 十 X， 那么 


协 方 差 : 设 X 和 了 是 两 个 随机 变量 . X 和 了 的 协 方差 记 作 cxy 或 者 Cov(X, 了)， 


oxy 三 正 [(X 一 AX)(Y 一 Ar)]. 


注意 ,Cov(X,X) 等 于 XX 的 方差 . 另外, 如果 成，… ,XX, 都 是 随机 变量 , 并 上 


Var(X) = WE 站 >》 Cov(Xi, 总 )， 


1<i<j<n 


实际 上 , 我 们 已 经 在 定理 9.6.2 的 训 


E 明 中 说 明了 这 一 点 . 唯 


的 变化 是 , 现在 不 


需要 利用 独立 性 来 说 明 交 叉 项 的 消失 , 而 是 将 它们 保留 下 来 , 并 说 明 它 们 正 是 所 谓 


的 协 方差 . 
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见 ( 因 


会 辐 
研 介 


到 目前 为 止 , 我 们 所 做 的 好 像 只 是 给 一 个 术语 起 了 名 字 . 实际 上 , 协 方差 很 常 
为 大 多 数 随机 变量 并 不 是 相互 独立 的 ), 而 且 它 共有 很 多 好 的 性 质 , 其 中 一 些 


E 9.8 节 吕 


么 左 侧 的 


讨论 


9 


.7 含 斜 度 与 峰 度 


蜂 然 三 阶 算 和 四 阶 矩 并 不 像 均值 和 方差 那样 经 常 使 用 , 但 它们 也 有 自己 的 名 字 


尾巴 会 比 右 侧 的 


的 不 对 称 性 . 因此 , 正 态 分 布 的 偏 斜 度 是 0, 因为 它 是 完全 
对 称 的 . 如 果 分 布 是 单 峰 的 , 也 就 是 说 , 概率 质量 函数 只 有 一 个 最 大 值 点 , 那么 从 偶 
斜 度 中 可 以 看 出 分 布 的 哪 一 侧 有 较 厚 或 较 长 的 尾巴 . 所 以 , 如 果 偏 斜 度 是 负 的 , 那 


和 用 法 . 偏 斜 度 和 峰 度 分 别 是 三 阶 中 心 距 和 四 阶 中 心 距 . 它们 能 让 你 看 到 分 布 的 形 
在 中 心 极限 定理 中 , 对 于 随机 变量 之 和 如 何 收敛 到 正 态 分 布 这 个 问题 , 它们 发 
挥 了 关键 作用 . 


偏 斜 度 测 量 了 分 布 日 


尾巴 更 厚 或 更 长 . 同样 地 , 如 果 偏 斜 度 是 正 的 , 那么 右 侧 


的 尾巴 要 


值 附近 的 波动 出 现在 哪里 . 

为 一 方面 , 峰 度 则 可 以 测 
小 的 数据 集 在 均值 上 有 一 定 的 平稳 性 . 举 一 个 极端 的 例子 , 具有 极 低 峰 度 的 分 布 是 
均匀 分 布 . 但 是 , 峰 度 较 高 的 分 布 在 其 均值 处 会 有 一 个 非常 尖 的 点 , 两 侧 都 有 陡峭 


比 左边 的 尾巴 更 厚 或 更 长 . 因此 , 在 理解 了 偏 斜 度 之 后 , 我 们 就 能 知道 均 


量 正 态 分 布 的 数据 是 如 何 到 达 峰 值 或 变 平 的 . 峰 度 较 


的 落 点 , 而 且 还 有 相对 较 厚 的 
3. 关于 人 


由 于 相互 独 


尾巴 .作为 常用 的 比较 样本 , 标准 正 态 分 布 的 峰 度 是 


i 竹 度 和 峰 度 的 不 等 式 , 请 参阅 习题 9.10.10 和 习题 9.10.11. 


9.8 协 方 差 


立 的 随机 变量 的 协 方差 是 0, 因此 协 方差 衡量 的 是 一 个 变量 的 变化 


会 如 何 影响 另 一 个 变量 的 变化 . 但 是 , 值得 注意 的 是 , 协 方差 为 0 并 不 表示 两 个 随 


机 变量 是 相互 独立 的 (参见 表 9-4 和 习题 9.10.27). 协 方差 测量 的 是 两 个 变量 之 间 


的 线性 相关 程度 . 协 方差 大 于 0 表明 了 两 个 变量 是 正 相 关 的 , 协 方差 小 于 0 则 意味 
着 它们 是 负 相 关 的 . 


与 协 方差 密切 相关 的 一 个 术语 是 相关 系数 . 相关 系数 p 被 定义 为 


_ Cov(X,Y) 


OxXxOY 


相关 系数 是 对 协 方 差 的 标准 化 , 我 们 始终 有 p se [一 1,1] (参见 习题 9.10.28). 它 描述 


了 恩 


个 变量 之 间 的 线 愧 


E 相 关 强 度 . 相关 系数 越 接近 -1 或 1, 线性 相关 性 就 越 强 . 
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表 9-4 随机 变量 X 和 YY 的 联合 概率 密度 函数 . 注意 , X 和 Y 的 均值 都 是 0, 它们 的 
协 方差 等 于 0, 但 是 这 两 个 随机 变量 不 是 相互 独立 的 
Pr(Y = 一 2) Pr(Y = —1) Pr(Y = 1) Pr(Y = 2) 
Pr(X = —2) 1/8 0 0 1/8 1/4 
Pr(X = —1) 0 1/8 1/8 0 1/4 
Pr(X = 1) 0 1/8 1/8 0 1/4 
Pr(X = 2) 1/8 0 0 1/8 1/4 
1/4 1/4 1/4 1/4 
对 于 任意 两 个 (离散 型 或 连续 型 的 ) 随机 变量 X 和 YY, 如 果 它 们 的 均值 分 别 是 
Lx 和 jy, 那么 X 和 了 的 协 方差 可 以 写成 
Cov(X,Y)= ELIXY| 一 xxHN7， 
注意 这 个 式 子 与 计算 方差 的 公式 有 多 人 么 相似 . 这 个 证 明 可 以 利用 期 望 的 线性 性 质 


给 出 : 


Cov(X,Y) = E[((X— px)(Y — pny)] 


IXY — uyX— hxY + hynx)] 


= ELXY] — pxELX| — pxElY] + Elyxpny] 
= ELXY]— jxky 一 AUXUY 十 XUAY 
= E[XY| 一 AxAr: 
9.9 总 结 
本 课程 最 重要 的 概念 之 一 是 随机 变量 的 期 望 . 我 们 讨论 了 它 的 儿 个 性 质 . 最 重 
要 的 是 线性 性 质 , 我 们 看 到 了 如 何 利 用 该 性 质 给 出 更 简单 的 证 明 (也 就 是 说 , 利用 
线性 性 质 , 可 以 避免 把 概率 密度 函数 明确 地 写 出 来 , 从 而 不 用 给 出 长 篇 论述 ). 


引入 《 捉 鬼 敢死队 》 里 


的 一 段 对 话 会 特别 合适 . 


温 斯 顿 ， 雷 德 莫 尔 : 我 们 有 工具 ! 我 们 是 天 才 ! 
彼得 温 克 受 : 现在 是 Miller 时 间 ! 
这 三 句 话 都 很 重要 . 首先 , 我 们 需要 合适 的 工具 . 如 果 没 有 合适 的 工具 , 就 无 法 
取得 任何 进展 . 期 望 就 是 一 个 强大 的 工具 , 充实 了 我 们 的 装备 . 其 次 , 只 拥有 这 些 工 
有 具 是 不 够 的 , 还 要 知道 如 何 使 用 . 例如 , 为 了 让 表达 式 更 加 简单 , 我 们 重新 排列 了 各 


项 . 改写 代数 表达 式 的 


|(CG + Xa) — (po + 


一 个 很 好 的 例子 是 


5 [C1 ~ pr) + (Xa — pox) 


9.10 习 题 289 


数学 中 最 困难 的 部 分 之 一 是 学 习 如 何 更 好 地 进行 代数 运算 . 如 果 能 把 代数 表达 式 改 


写成 较 好 的 形式 , 那么 你 就 可 以 看 到 其 中 的 关联 , 3 


名 话 是 对 Miller 牌 啤酒 的 (非常 老 的 ! ) 


合情合理 的 


习题 9.10.1 
习题 9.10.2 
习题 9.10.3 


0 的 右 催 
习题 9.10.4 


式 法 则 .) 


习题 9.10.5 


习题 9.10.6 
限 的 , 那 
限 的 ? 

习题 9.10.7 


个 不 同 的 函数 , 那么 (f(x)+g(z)) 
设 X 是 一 个 离散 型 随机 变量 . 
对 于 接 下 来 的 四 道 习题 , 这 里 有 一 些 不 错 的 分 布 可 以 利用 . 


习题 9.10.8 


酒 的 方式 来 庆祝 解决 了 问题 , 但 是 垦 


! 


9.10 


知道 该 如 何 继续 下 去 . 最 后 一 


广告 宣传 ， 


习 


而 不 是 我 的 看 法 . 我 不 建议 用 喝 


E 掌 握 了 一 个 较 长 的 技巧 性 论证 后 , 庆祝 一 下 是 


题 


写 出 下 列 函 数 的 前 5 个 泰勒 系数 , 或 者 说 明 为 什么 无 法 写 出 . (a) log(1 一 在 
uw 二 0 处 ; (b) log(1 一 局 ) 在 ==0 处 ; (c) zsin(l/z) 在 z=0 处 . 

在 9.2 节 中 , 我 们 发 现 导 ?_。 如 (四 2-" 等 于 的 二 次 多 项 式 . 如 果 把 妇 蔡 换 
成 妇 , 结果 是 什么 ? 它 也 是 关于 m 的 多 项 式 吗 ? 如 果 是 的 话 , 是 什么 样 的 多 项 式 ? 


| 趋 近 于 0. 


,gn 都 是 连续 函数 . 证 明 : 已 知 下 列 期 望都 是 有 
么 下 [aigi(X) 十 …: 二 angn(X)] = 并 ”axE[gx(X)]. 为 什么 要 假设 这 些 量 是 有 


通过 计算 lim。,o+ /. qz/z 来 证 明 有 dz/z 是 无 穷 大 的 , 符号 e 一 0 表示 e 从 


证 明 : arctan(z) 的 导数 是 1/(1 + x). (提示 : 对 tan(arctan(z)) = z 应 用 链 


证 明 : 无 论 4 和 B 沿 着 什么 方向 趋 近 于 无 穷 大 , 极限 lima,p_。o szdz 
始终 存在 . 如 果 把 被 积 函数 换 成 | 吓 =|, 情况 就 一 样 
设 X 是 一 个 随机 变量 , g1,… 


了 


在 9.5 节 中 , 我 们 讨论 了 利用 定义 给 出 证 明 的 概率 有 多 大 . 这 种 情况 在 微 积 分 的 
证 明 中 很 常见 . 利用 导数 的 定义 , 证 明和 的 求 导 法 则 与 乘积 的 求 导 法 则 : 如 果 上 和 9 是 
= f(z)+9 (x) HE (f(z)9(2)) = 万 (z)g(z) 十 AZz)g (2). 
证 明 或 反 驱 : E[1/X] = 1/E[X]. 


Cea: 


。 均匀 分 布 : 当 0 < x < 1 时 , fx(x)=1; 否则 fx(x)=0. 


。 指 数 分 布 : 当 z > 0 时 , fx (z) = exp(z): 否则 fx (z) =0. 
。 拉 普 拉 斯 分 布 : fx (z) = exp(--|z|)/2. 


。 卡 方 分 布 : 当 x > 0 时 , fx (zx) = x*/2-1exp( 一 zx/2)/2"/2T(v/2); 否则 fx(x) = 0; 其 


CH 
六 


> 0 而 且 下 (s) 是 伽 马 函数 . 


。 正 态 分 布 : fx(z) = (2m 由 -LU2 exp( 一 z2/2). 
计算 一 些 常见 分 布 (如 上 面 这 些 分 布 ) 的 前 四 阶 中 心 矩 . 试 着 找 出 峰 度 的 一 个 


习题 9.10.9 


下 界 ， 


把 它 写 成 关于 偏 斜 度 以 及 其 他 


E[X]? 吗 ? 


F 心 距 的 表达 式 . 换 句 话说 , 你 能 概括 出 E[X?] > 
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习题 9.10.10 ”给 定 一 个 随机 变量 X, 它 的 前 天 > 4 阶 矩 都 是 有 限 的 , 并 设 jw = E[(X 一 1)*]. 
对 于 几 个 常见 的 分 布 , 验证 不 等 式 (jwa/o) > (uay/c3) 2 十 工 均 成 立 , 其 中 c 是 标准 差 . 注 
意 , uw/o 是 无 单位 的 , 它 是 我 们 研究 的 自 

习题 9.10.11 ”证 明 上 一 题 中 的 不 等 式 . 

习题 9.10.12 ”根据 上 面 这 两 道 习题 , 能 不 能 利用 低 阶 中 心 距 概括 出 关于 六 阶 中 心 矩 的 不 等 
式 ? 探讨 一 下 ! 

习题 9.10.13 ”考虑 一 副 包 含 52 张 牌 的 标准 牌 . 假设 所 有 牌 都 被 彻底 打 乱 了 , 那么 52! 种 
排列 方法 出 现 的 概率 都 是 相等 的 . 我 们 每 次 都 (无 放 回 地 ) 选 出 一 张 牌 , 直到 选 出 两 张 相 
同 花 色 的 牌 为 止 . 当选 出 两 张 相同 花色 的 牌 时 , 拿 到 的 总 牌 数 的 期 望 值 是 多 少 ? 方差 是 多 
少 ? 

习题 9.10.14 ”考虑 两 个 随机 变量 之 和 YY = Xi + X2. Y 的 均值 是 否 依赖 于 Xi 和 Xs 的 独 

立 性 ? 如 果 Var(Xi) = Var(X2) = o 那么 Var(Y) 的 最 大 值 和 最 小 值 分 别 是 多 少 ? 

习题 9.10.15 ”已 知 X 和 YY 是 两 个 相互 独立 的 随机 变量 . 证 明 : E[XY] = E[X]E[Y]. 

习题 9.10.16 ” 设 Xi ,X 是 相互 独立 且 同 分 布 的 随机 变量 , 它们 不 取 正 数 的 概率 都 是 
0. 证 明 : 当 1< mn 时 ,EE[( 庆 十 … 十 Xm)/( 对 i 十 … 十 Xn)| = m/n. 这 个 结果 是 不 
是 有 些 让 人 意外 ? 

习题 9.10.17 ”对 于 服从 标准 正 态 分 布 的 随机 变量 , 其 概率 密度 函数 是 - 孝 : exp( 一 x?/2). 计 
算 它 的 前 4 阶 算 . 

习题 9.10.18 ”证 明 : 当 m,n € {1,2,3,…} 时, Pr((X,Y) = (m,n)) = 去 去 是 一 个 联合 

习题 9.10.19 。” 求 出 Prob((X,Y) = (m,n)) = 去 声 的 边缘 分 布 , 其 中 m,n e {1,2,3,.…}. 
X 和 了 是 相互 独立 的 吗 ? 

习题 9.10.20 ”一 个 随机 变量 在 正方 形 [0, 1]? 中 均匀 取 值 . 已 知 该 随机 变量 满足 2? 十 < 1， 
求 出 匀 的 边缘 分 布 . 找到 Y 的 边缘 分 布 . 在 附加 条 件 z2 十 只 科 1 下 ,X 和 普 是 相互 
独立 的 吗 ? 如 果 去 掉 这 个 条 件 , 它们 是 否 相 互 独立 ? 

习题 9.10.21 ”如 果 X ~ Bin(n,p) (随机 变量 X 服从 参数 为 n 和 p 的 二 项 分 布 ), 求 出 了 X 
的 二 阶 矩 和 三 阶 拢 . 

习题 9.10.22 ”假设 你 在 图 书馆 里 . 你 始终 相信 自己 花费 在 图 书馆 里 的 时 间 等 于 大 学 生 在 图 
书馆 花费 时 间 的 平均 值 . 为 了 验证 这 一 点 , 你 决定 走 遍 图 书馆 去 问 问 每 个 人 在 那里 花费 了 
多 少时 间 . 你 发 现 , 你 询问 的 那些 人 在 图 书馆 的 平均 时 间 要 比 你 在 图 书馆 的 时 间 多 得 多 . 
这 是 否 与 你 的 观点 相 矛 盾 ? 

习题 9.10.23 ”如 果 被 你 询问 的 那些 人 在 图 书馆 的 平均 时 间 要 比 你 在 图 书馆 的 时 间 少 很 多 ， 
那么 这 是 否 与 你 坚信 自己 花费 在 图 书馆 里 的 时 间 等 于 大 学 生 在 图 书馆 花费 的 平均 时 间 相 
矛盾 ? 

习题 9.10.24 ”假设 学 校 里 的 学 生 是 均匀 分 布 的 , 他 们 每 天 花 1 到 5 个 小 时 在 图 书馆 学 习 . 
另外 , 每 个 人 在 图 书馆 的 时 间 与 其 他 人 在 图 书馆 的 时 间 是 相互 独立 的 . 在 某 个 给 定时 刻 ， 
当前 正在 图 书馆 里 的 人 花费 在 图 书馆 的 时 间 服 从 什么 分 布 ? 

习题 9.10.25 ”一 个 学 生花 费 在 图 书馆 里 的 平均 时 间 是 多 少 ? 图 书馆 里 所 有 人 花费 在 图 书 


沪 


里 . 


访 
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的 
习题 9.1 
解释 


习题 9.10.27 


0.26 


F 均 时 间 是 多 少 ? 假设 每 个 人 都 与 
假设 与 投资 收益 相关 的 随机 变量 是 相互 独立 的 . 对 了 
一 下 投资 的 多 样 化 是 如 何 最 大 化 预 
E 明 表 9-4 中 的 随机 变量 X 和 YY 不 是 相互 独立 


训 


其 他 人 相互 独立 . 


一 个 给 定 


的 收益 方差 ,请 


期 收益 的 . (在 实 


以 考察 联合 概率 不 为 0 时 X 和 了 的 大 小 . 


习题 9.10.28 


习题 9.10.29 
习题 9.10.30 


及 其 


在 第 二 次 世界 大 战 
门 知 道德 国人 把 坦克 从 1 连续 编号 到 某 个 未 知 数 N. 


列 号 是 m. 


订 


.) 


订 


E 明 : 相关 系数 的 绝对 从 


正明 : 不 管 我 们 为 XX 和 Y 指定 什么 档 
设 了 = 100X 


践 中 , 这 并 不 是 个 很 好 的 假设 .) 
和 1， 你 可 以 直接 计算 , 也 可 


不 可 能 大 了 


X2, 其 


PX 在 [-1,1] 


相关 系数 . 


PP, 同盟 国 希 望 


1. (提示 : 利 


的 单位 , 相关 系数 都 是 无 
均匀 取信 


j B.6 节 的 柯 西 - 施 瓦 效 不 


位 的 . 
. 计算 X 和 YY 的 协 方差 


能 找到 一 个 


他 们 俘 习 


大 


此 有 必要 通过 者 


习题 9.10.31 


来 估算 德国 生产 的 坦克 数量 的 好 方法 . 


他 
了 尼 辆 坦克 , 而 观察 到 的 最 大 序 


不 幸 的 是 , 被 俘获 的 坦克 数量 ( 即 及) 还 不 够 大 , 不 足以 让 盟 军 合理 地 预计 m  N， 
得 更 大 的 m 来 进行 更 准确 的 估计 . 假设 M 是 一 个 随机 变量 , 表示 观察 到 的 
最 大 序列 号 . 下 面 讨论 了 估算 德国 坦克 数量 的 一 种 方法 . 我 们 将 在 12.7 节 中 给 出 相关 证 明 . 
对 于 给 定 的 上 和 N, 计算 m = nn 的 概率 . 
对 于 给 定 的 NN 和, 求 出 m 的 均值 (要 小 心地 进行 大 量 代数 运算 ). 解 出 关 


习题 9.10.32 
于 N 的 方程 , 从 而 得 到 一 个 
来 模拟 从 N 软 
式 的 有 效 性 . 
坦克 问题 进 


习题 9.10.33 
测试 估算 的 
习题 9.10.34 “对 德国 
道 这 些 编号 是 多 少 , 但 我 们 可 
m1、 最 大 序列 号 是 m2, 那么 请 
假设 我 们 要 在 一 个 


名 地 选 出 一 个 7, 并 从 [0,2n) 


习题 9.10.35 


mm 和 来 表示 中 


与 


公 


编 


从 [V1— zx2,vV1l— 7x2] 9 
对 (7,9) 的 选择 来 求 出 (zx,y) 


坦克 中 观察 到 有 软 


行 推广 ,1 
以 观察 到 软 
估算 出 坦克 
单位 
均匀 


腿 设 ] 


的 数量 . 


旦 


百 
由 


的 联合 概率 密度 函数 ? 


的 关于 和 的 公式 . 
坦克 的 代码 . 当 


胆 克 从 Ni 开 
坦克 的 序列 号 . 如 果 观 察 到 的 最 小 序列 号 是 


盘 上 均匀 地 选 出 一 
也 选 出 一 个 0. 这 与 从 [一 1 
均匀 地 选 出 一 个 y 是 一 样 的 吗 ? 如 


观察 到 辆 坦克 时 ， 


台 被 连续 编号 到 No. 虽然 不 知 


的 方法 是 从 [0,1] 中 均 
, 1] 中 均匀 地 选 出 一 个 zx， 
果 不 一 样 , 那么 如 何 通 过 


3 


到 


的 
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时 间 是 一 场 风 暴 , 我 们 都 迷失 在 其 中 . 只 有 在 风暴 本 身 的 回旋 中 , 我 们 才能 找 


方向 . 


一 威廉 卡 洛斯 威廉 斯 《成 廉 卡 洛斯 ”威廉 斯 文选 》(1954) 


在 前 几 章 中 , 我 们 研究 了 随机 变量 , 并 取得 了 很 大 的 成 功 . 关于 随机 变量 , 最 
然 的 问题 就 是 它 的 概率 密度 是 多 少 ? 不 六 的 是 , 从 XX 和 YY 的 概率 密度 过 渡 到 它 介 


和 X+Y 的 概率 密度 3 
为 我 们 还 没有 过 多 地 讨论 为 什么 要 添加 很 多 


不 容易 . 如 


果 加 入 


随机 变量 


更 多 的 随机 变量 , 那么 情况 会 更 粮 . 


, 所 以 现在 就 来 简单 地 介 乡 


下 , 这 强调 了 求 出 这 些 新 的 概率 密度 函数 的 必要 性 . 弄 清楚 如 何 做 到 这 一 点 是 本 章 


的 


们 


杂 


在 


两 大 主题 之 一 . 
因为 我 们 可 以 轻松 


会 这 样 做 ! ), 所 以 这 是 


的 问题 简化 成 许多 简单 的 
数论 中 ， 


人 人 
5 


i 


出 


些 例子 都 说 明了 同一 个 原理 : 把 一 个 


中 


过 


正 
日 
把 


, 我 们 也 可 以 


月 这 样 做 . 例 
抛掷 一 颗 般 子 的 可 能 结果 ,，j 


了 解 抛 扼 一 枚 均匀 硬币 的 结果 来 到 


股 化 的 侦 
问题 . 在 化 学 课 | 


省 把 所 有 结果 组 
E 解 ， 


打 


当然 , 这 个 


在 试 着 理解 消费 者 的 行为 : 可 能 想 了 解 


程 安排 
它们 组 合 在 一 起 . 


关键 是 , 我 们 要 真正 理 角 
定理 9.5.1 给 出 了 计算 随机 变量 组 合 上 
来 表示 . 我 们 将 在 第 19 章 中 更 详细 
关 的 线索 . 当然 , 如 果 能 知 
积 提供 了 很 好 的 方法 来 得 到 


信 4 


昌 ! 


道 这 个 分 布 训 


也 通过 添加 随机 变量 的 相关 应 用 来 把 几 章 内 容 补充 完整 (我 
给 子 . 科学 的 重要 教训 之 一 是 , 把 一 个 复 


上 , 你 要 学 会 把 化 合 物 分 解 成 组 成 原子 . 
你 学 习 把 整数 分 解 成 素数 的 乘积 . 我 们 还 可 以 给 出 很 多 其 他 的 例子 , 这 
的 物体 分 解 成 更 简单 的 成 分 ， 在 概率 论 
如 , 要 想 弄 清楚 抛 撕 n 颗 均 匀 山 子 的 结果 , 只 需要 了 解 
合 起 来 就 行 了 . 同样 地 , 我 们 也 可 以 通 
邮 括 n 枚 硬币 的 情形 . 
原理 的 宝贵 价值 不 仅仅 体现 在 抛 括 硬 


币 般 子 上 . 想象 一 下 , 我 们 


EE 影 市 场 的 需求 , 或 者 要 为 航空 公司 设计 


, 又 或 者 要 把 产品 送 到 市 场 . 可 以 尝试 理解 不 同 个 体 行为 的 可 能 性 


然后 


立 随 机 变量 之 和 . 我 们 在 9.5 节 中 取得 了 一 些 进 展 , 其 中 
的 期 望 值 的 公式 , 它 可 以 上 
地 看 到 , 一 个 分 布 的 矩 会 提供 与 该 分 布 性 质 有 
更 好 了 ! 这 就 是 引入 卷 积 的 地 方 一 一 卷 
随机 变量 之 和 的 概率 密度 函数 , 这 恰好 是 我 人 


] 随 机 变量 的 期 望 值 


] 想 了 解 的 


之 前 说 过 , 找到 相互 独立 的 随机 变量 之 和 的 概率 密度 函数 是 本 章 的 两 大 主题 之 


个 主题 是 变量 替换 公式 的 相关 结果 . 虽然 这 


丙 个 主题 看 起 来 相距 甚 远 , 但 
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它们 之 间 存 在 自然 的 联系 , 也 正 是 


办 为 这 一 点 才 把 它们 放 在 了 同一 章 . 变量 蔡 换 公 


式 可 以 由 一 个 随机 变量 的 概率 密度 函数 得 出 男 一 个 相关 随机 变量 的 概率 密度 函数 . 
具体 地 说 , 如 果 随 机 变量 X 的 概率 密度 函数 是 fx, g 是 一 个 恰当 的 函数 , 那么 可 以 


利用 fx 和 9 求 出 工 = g(X) 的 概率 密度 函数 . 注意 这 与 卷 积 有 多 么 相似 . 对 于 每 


个 随机 变量 , 我 们 都 试 着 利用 其 组 成 部 分 的 概率 密度 函数 来 找 出 i 


10.1 “ 卷 积 : 定义 和 性 质 


在 不 知道 卷 积 的 情况 下 , 我 们 也 可 以 讨论 随机 变量 的 和 , 但 这 个 过 程 3 


卷 积 的 出 现 是 为 了 便于 计算 随机 变量 之 和 的 概率 密度 函数 . 我 们 
细 地 讨论 生成 函数 , 看 看 该 如 何 使 用 卷 积 . 事实 上 , 卷 积 在 中 心 极限 定型 


起 了 关键 作用 , 而 中 心 极限 定理 不 仅 是 概率 论 中 的 一 颗 宝 石 , 也 是 整 


瑰宝 ! 


玄 随 机 变量 的 概率 


不 愉快 ! 
会 在 第 19 章 中 详 
的 证 明 中 


电 的 性 质 , 并 把 涉及 卷 积 应 用 


日 


的 其 余 材 料 都 留 


个 数学 理论 的 


因为 卷 积 十 分 重要 , 所 以 关于 卷 积 有 个 深奥 的 理论 也 就 不 足 为 奇 了 . 现在 , 我 
们 只 看 定义 和 一 些 虽然 基本 但 非常 有 
到 具体 的 分 布 和 中 心 极限 定理 的 证 明 


这 里 有 个 基本 框架 . 假设 有 一 个 概率 密度 函数 为 fx 的 随机 变量 X 和 另 一 个 
概率 密度 函数 为 fy 的 随机 变量 7, 我 们 想 知 道 2 = X 十 Y 的 概率 密度 函数 是 多 
少 . 如 果 这 是 我 们 所 知道 的 全 部 信息 , 那么 很 遗憾 , 我 们 的 运气 很 不 好 ! 和 之 前 一 
样 , 当 对 和 YY 不 相互 独立 时 , 问题 就 出 现 了 . 


不 妨 设 


以 及 


若 --1/2< zx<1/2 
其 他 


若 --1/2<y<1/2 
其 他 . 


注意 , X 和 YY 的 概率 密度 函数 是 一 样 的 , 而 X 和 -X 也 是 如 此 ! 如 果 令 了 = 一 X， 


那么 Z = 和 +Y 就 始终 为 0; 但 如 果 令 了 =X, 那么 Z=X 和 +TY 就 是 2X, 并 


万 x(2) -1 


1/2 
0 


这 里 有 个 重要 启示 : 只 知道 fx 和 fy 并 不 足以 而 
和 


们 还 知道 X 和 了 是 相互 独立 的 , 那么 情况 就 完全 不 同 了 . 在 这 利 


情况 下 , 1 


定 fx+Y. 幸运 的 是 , 如 果 我 


世界 将 
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再 次 变 得 美好 , 可 以 得 到 一 个 计算 fz 的 具体 公式 . 
在 陈述 主要 结果 之 前 , 我 们 先 看 一 些 符号 , 并 做 好 预备 工作 . 


定义 10.1.1 设 铸 和 YY 是 定义 在 恨 上 的 两 个 相互 独立 的 连续 型 随机 变量 , 它 
们 的 概率 密度 函数 分 别 是 fx 和 育 . X 和 了 的 卷 积 记 作 fx * fy, 其 表达 式 为 


Cp 由 人 
如 果 X 和 了 都 是 离散 型 随机 变量 , 那么 


(fx* fy)(2) = >》 fx (zn)fy(z — zn). 


当然 , 要 注意 , 除非 xz- zw 等 于 Y 有 正 概率 时 的 取 值 ( 即 z -xw, 取 菜 个 具体 的 
ym), 否则 fy(z 一 zn)==0. 
两 个 随机 变量 的 卷 积 有 很 多 奇妙 的 性 质 , 其 中 就 包括 下 面 的 定理 . 
定理 10.1.2 设 X 和 了 是 定义 在 取 上 的 两 个 相互 独立 的 连续 型 或 离散 型 随 
机 变量 , 它们 的 概率 密度 函数 分 别 是 fx 和 fy. 如 果 了 = 和 二 YY, 那么 
fz(2)= (fx * fy)(2). 
另外 , 卷 积 是 可 交换 的 : fx * fy = fy*fx. 
证 明 : 我 们 会 给 出 关于 连续 型 随机 变量 的 证 明 , 离散 的 情况 与 之 相似 . 
先 来 证 明 与 Z 的 概率 密度 函数 有 关 的 论述 . 让 fz 表示 2 的 概率 密度 函数 , 并 
让 Fz 表示 2 的 累积 分 布 函数 . 我 们 总 是 可 以 通过 微分 累积 分 布 函数 来 求 出 概率 
密度 函数 . 于 是 


Fz(z) = Prob(Z < 2). 
这 个 概率 该 如 何 计算 呢 ? 不 妨 设 X 的 值 是 t. 由 于 要 求 2 = XX 十 Y 的 值 不 超过 z， 
因此 YY 的 取 值 至 多 为 zt. 从 定义 来 看 , 这 个 概率 就 是 Fy (zt) = Prob(Y < zz 一 人 . 
让 上 取 遍 X 所 有 可 能 的 取 值 , 于 是 有 
Fz(z) 一 1 fx(t)Fy(z ee t)dt. 


0 
现在 在 积分 号 下 求 微分 . 在 数学 课 上 , 这 一 点 的 合理 性 必须 要 得 到 证 明 , 但 是 很 多 
教师 要 么 忘记 了 证 明 , 要 么 刻意 回避 这 部 分 证 明 . 在 本 章 结尾 的 习题 中 , 会 给 出 
些 不 能 进行 互 换 的 情况 . 笠 运 的 是 , 在 这 里 交换 积分 和 求 导 的 次 序 是 合理 的 . 关于 
何 时 能 做 到 这 一 点 , 请 参阅 B.2.1 节 . 我 们 有 


fz)=E /Om 
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=/ EUW 


t 一 一 co 


加 人 fx Ey( —t)dt 


t=—008 


= 人 挛 的 户 (z 一 力 dt 


t 一 一 Co 


= (fx * fy)(2). 


对 于 第 二 个 结论 , 如 果 fx 和 fy 都 是 概率 密度 函数 , 那么 证 明 会 非常 简单 . 我 
们 刚刚 证 明了 , 当 2Z 是 两 个 相互 独立 的 随机 变量 X 与 Y 的 和 时 , 2 的 概率 密度 函 
数 就 是 fx* fy. 因为 加 法 是 可 交换 的 ,所 以 了 +X 也 等 于 2, 进而 有 xy = fy+x. 
尽管 我 们 并 不 需要 , 但 任意 两 个 函数 的 卷 积 都 是 可 交换 的 , 而 不 仅仅 是 一 个 积分 值 
为 1 的 非 负 函 数 . 

我 真 的 很 喜欢 上 面 第 二 个 结论 的 证 明 . 这 是 个 很 好 的 例子 , 说 明了 正确 看 待 问 
题 的 重要 性 . 我 们 可 以 通过 写 出 每 个 式 子 分 别 等 于 多 少 来 证 明 fx * fy = fy * jx， 
然后 通过 变量 替换 来 证 明 它 们 是 等 价 的 , 但 是 , 注意 到 加 法 是 可 交换 的 会 更 好 . 这 
是 个 典型 的 问题 一 一 你 可 以 采用 多 种 代数 方法 解决 问题 , 但 通常 会 有 更 好 的 方法 . 

在 陈述 了 这 样 一 个 具有 技巧 性 的 结果 并 给 出 相关 证 明 后 , 我 们 来 看 看 它 在 实践 
中 是 如 何 发 挥 作用 的 . 假设 X 和 了 是 相互 独立 的 随机 变量 , 它们 具有 相同 的 概率 
密度 函数 


1 若 -1/2 乏 上 过 1/2 
其 他 . 


通过 计算 


太 AO -Da 


可 以 求 出 Z= 半 十 Y 的 概率 密度 函数 . 然而 , 我 们 必须 非常 小 心 . 学 生 们 最 容易 犯 
的 错误 之 一 就 是 用 1 来 替换 f(t) 和 f(z 一 t), 并 让 t 在 一 1/2 和 1/2 之 间 取 值 , 而 
这 种 做 法 是 错误 的 ! 这 里 的 替换 出 了 什么 问题 ? 问题 在 于 , 只 有 当 -1/2 < wu < 1/2 
时 , 函数 ff) 才 会 等 于 1， 如果 f(t) = 1. 那么 就 意味 着 -1/2 < t < 1/2， 如 果 
f(z 一 ) = 1, 那 就 表明 了 一 1/2 < z 一 t+ < 1/2, 也 就 是 说 , z 一 1/2 <t<z 十 1/2. 因 
此 , 这 个 积分 必须 分 情况 讨论 . 关于 这 一 点 , 我 们 会 在 13.1.2 节 讨 论 服 从 均匀 分 布 
的 随机 变量 之 和 时 给 出 进一步 说 明 . 具体 地 说 , 我 们 将 分 别 讨论 |z| >1 和 |z|<1 
的 情形 . 

好 吧 , 上 面 的 内 容 让 人 觉得 有 点 诅 丧 . 有 一 点 还 不 错 , 那 就 是 只 需要 计算 一 个 
积分 值 , 而 不 是 分 段 定 义 的 积分 . 但 问题 在 于 , 最 初 的 函数 可 能 是 个 分 段 函数 . 如 
果 该 函数 对 所 有 的 输入 都 有 相同 的 定义 , 那么 情况 又 是 什么 样 的 ? 虽然 这 确实 有 点 


| 


©O 
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变量 蔡 


换 


微分 ， 


帮助 , 但 存在 


个 根本 的 困 


此 ,就 


后 退 一 步 , 我 们 会 看 至 


难 : 积分 很 
日 对 于 包含 这 些 函 数 的 一 般 积 分 来 说 , 有 
像 我 们 希望 找到 关于 卷 积 的 漂亮 表达 式 一 样 , 往往 徒劳 无 功 . 


作 计 算 ! 虽然 我 们 总 能 对 初等 函数 的 组 合 求 
简单 的 解析 表达 式 是 很 罕见 的 . 因 


会 | 


还 有 一 丝 


析 表 达 式 , 但 卷 积 仍然 有 用 . 还 能 用 
关于 随机 变量 之 和 的 怕 


日 


始 
第 


be 


疆 


引 


式 公 式 , 但 


着 手 这 方面 的 研究 , 3 


由 此 推 


L 


21 章 中 看 到 一 个 叫 作 傅 : 
换 的 乘积 . 我 们 将 利 月 


束 时 , 必须 逆转 该 过 
接 下 来 几 章 讨论 
卷 积 . 但 卷 积 会 让 人 感到 


最 终 的 积分 3 


卷 积 做 
E 质 , 所 以 卷 积 仍 是 个 很 好 的 工具 . 在 第 19 章 中 
推导 出 关于 中 心 极限 定理 的 证 明 . 事实 上 , 我 


希望 . 虽然 不 总 
EE 


| 关于 概率 密度 函数 的 解 
月 卷 积 推导 出 大 
,我 们 将 


门 会 在 


能 得 至 


什么 呢 ? 我 们 可 以 利 


二 站 


j 这 个 结果 ,让 


叶 变 换 的 床 亮 运算 , 卷 积 的 傅 里 叶 变 换 就 是 傅 里 叶 变 
巴 困 难 


的 卷 积 积 分 转换 成 简单 的 乘法 运算 (但 在 


有 什么 意义 呢 ! 


有 种 观点 是 , 需求 是 发 明之 母 . 面 


讽 . 这 种 局 面 


昌 ! ), 这 样 卷 积 的 一 些 缺 点 就 消 
的 是 特殊 的 随机 变量 . 在 这 个 过 程 中 , 我 们 会 更 加 详细 
I 喜忧参半. 没 错 , 卷 积 给 出 了 一 个 关于 概率 密度 函数 的 显 
不 容易 计算 . 如 果 求 不 


失 - 汪 ; 


地 研究 


出 积分 值 , 那么 知道 它 的 表达 式 又 


2 


对 无 法 使 用 的 答案 对 我 们 来 说 是 种 可 


的 噶 


促使 许多 研究 人 员 去 寻 


提 到 的 , 另 一 种 看 法 是 , 对 于 数学 中 
足够 了 . 令 人 惊讶 的 是 , 在 第 20 章 


的 许多 问题 , 只 要 知道 事物 或 公式 的 存在 ' 


找 能 够 计算 这 种 积分 的 技巧 . 正如 我 们 前 


面 所 
生 就 


中 


极限 定理 所 需 的 全 部 内 容 ! 


10.2 “ 卷 积 : 


10.2.1 ”理论 计算 


下 面 


考察 一 些 卷 积 的 例子 . 第 


, 我 们 将 看 到 这 种 存在 性 基本 上 就 是 证 明 


中 心 


据 般 子 的 例子 


个 例子 是 抛 括 两 颗 均 匀 的 骨 子 . 假设 两 颗 肯 子 


掷 出 的 结果 是 相互 独立 的 . 让 X 表示 第 一 颗 骨 子 掷 出 的 数字 , Y 表示 第 二 颗 人 般 子 


拓 出 的 数字 . 于 是 , 我 们 有 


fx(h) 


0 


1/6 


若 ke {1,2,3,4,5,6} 
其 他 . 


在 7.2 节 中 , 我 们 把 36 对 可 能 的 结果 以 及 每 1 对 所 对 应 的 XX 十 Y 的 取 值 全 都 列举 


了 出 来 , 并 1 


此 求 出 和 +Y 的 概率 密度 函数 . 当 抛掷 两 颗 骨 子 时 可 以 这 样 做 , 但 随 


行 代数 运算 . 


着 仍 子 数量 的 增加 , 这 种 做 法 就 变 得 不 切实 际 了 . 幸运 的 是 , 卷 积 可 以 指导 我 们 进 
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根据 定理 10.1.2 以 及 卷 积 的 定义 可 知 , 如 果 Z = X+Y, 那么 
jz(z) = (fx* fy)(z = )fy(z—&). 
天 一 一 co 
由 于 当 参 数 不 属于 {1,… ,6} 时 fx 和 fy 都 等 于 0, 因此 这 里 必须 同时 满足 
keE{1l,...,6} 且 zke{l,...,6}. 

好 的 , 这 意味 着 什么 昵 ? 首先 , 由 1 < < 6 以 及 大 是 个 整数 可 知 , 我 们 可 以 限制 和 
的 大 小 . 其 次 , > 必须 是 整数 . 最 后 , 不 管 选择 哪个 大 总 能 找到 某 个 合理 的 z. 当然， 


我 们 不 应 该 这 么 考虑 . 最 好 把 z 看 作 是 已 知 的 ， 然后 求 册 k 的 可 能 取 值 . 这 两 个 条 
件 意味 着 


{Zz—6,z2—5,2—4,z—3,z—2,z—1} N {1,2,3,4,5,6}. 
例如 , 当 z=2 时 ,有 只 能 取 1, 但 如 果 z=8, 那么 大 的 可 能 取 值 有 2、3、4、5 和 6. 
因此 , 现在 只 需要 算出 z 取 11 个 整数 值 的 概率 密度 , 它们 是 介 于 2 和 12 之 间 


的 整数 . 例如 ， 


6 


a 河 

= 2 fx th) )fy(8—&) ee 全 三 

这 样 继续 进行 下 去 ， 我 们 会 看 到 
2 
大 z€ {2,.… ,7} 
Ret 
fz(k)=4 1 13-z 
2 二 若 z € {7,.… ,12} 
之 机 36 
0 其 他 . 


10.2.2” 卷 积 码 
我 们 已 经 有 一 段 


时 间 没 有 通过 


定义 函数 (但 你 可 能 更 喜欢 自己 写 函 数 , 从 而 对 输出 有 
就 是 计算 卷 积 的 代码 , 并 且 提 供 了 输出 结 


In[11]: = Convolve [PDF [DiscreteUniformDistribution[{1, 
PDF [DiscreteUniformDistribution[{1, 


3 36 7<y<12 
11| = 
Out 入 (~21Y) 2<y<7 
0 True 
图 10-1 两 个 离散 型 随机 变量 的 卷 积 码 , 这 


两 个 变量 都 在 {1……， 


代码 来 验证 了 . Mathematica 有 用 来 求 卷 积 的 预 


更 多 的 控制 ). 图 10-1 所 示 的 


6}], 
x, y] 


x], 


6}], 


x], 


于 


中 均匀 取 


6} 1 
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我 们 可 以 求 出 4 颗 仍 子 搓 出 的 数字 之 和 的 概率 密度 函数 , 其 结果 仍然 是 一 个 
解析 表达 式 , 但 它 的 运行 时 间 更 长, 而 输出 的 内 容 自然 也 会 复杂 很 多 (如 图 10-2 所 
示 )! 


In[12]: = Convolve [Convolve [PDF [DiscreteUniformDistribution[{1, 6}], x], 
PDF [DiscreteUniformDistribution[{1, 6}], x], x, yl], 
Convolve [PDF [DiscreteUniformDistribution[{1, 6}], t], 
PDF [DiscreteUniformDistribution[{1, 6}], t], t, yl], y, 2z] 


(-24+Z) (-9+2z)? 


3888 Se 
2852-924z+96z2-3z3 
7776 9<Z<14 
13 824-1728z+72z2-Z3 
7776 19<z<24 
Out[12] = -10 1 Bt i 
本 中 Ey 2 十 3 
64 人 区 4<z<9 
-13 612+2604z-156z2?+3z3 
7776 14<z<9 
0 True 


证 


图 10-2 ”四 个 离散 型 随机 变量 的 卷 积 码 , 这 四 个 变量 都 在 {1,.… ,6} 中 均匀 取 人 


上 述 过 程 的 复杂 性 强烈 地 表明 了 我 们 需要 更 好 的 方法 . 不 幸 的 是 , 现实 中 曾 出 
现 过 很 多 次 答案 是 大 量 代数 运算 的 情况 , 而 这 就 是 其 中 之 一 ! 你 可 以 尝试 求 出 8 颗 
般 子 撕 出 的 数字 和 的 概率 密度 函数 (我 要 为 其 他 内 容 节 省 页 面 , 而 且 也 没有 足够 的 
空间 把 这 部 分 内 容 打印 出 来 ). 但 是 , 刚才 看 到 的 复杂 性 说 明了 , 我 们 可 能 在 研究 一 
个 错误 的 问题 . 我 们 正在 做 的 是 求 出 数字 和 的 精确 概率 . 在 许多 应 用 中 , 只 要 有 很 
好 的 近似 就 足够 了 , 我 们 不 需要 实际 值 , 只 需要 一 个 近似 值 . 这 就 引出 了 中 心 极 限 
定理 , 对 任何 一 门 课 来 说 , 它 都 是 重点 之 一 . 我 们 将 看 到 , 如 果 把 越 来 越 多 独立 同 分 
布 的 随机 变量 加 起 来 , 那么 它们 的 和 就 会 收敛 到 正 态 分 布 . 通过 绘制 上 述 内 容 的 图 
形 (或 者 阅读 图 10-3), 你 就 可 以 看 到 分 布 的 正常 形状 . 稍 后 , 我 们 会 花费 大 量 时 间 
来 讨论 中 心 极限 定理 . 


10.3 ”多 变量 的 卷 积 


我 们 已 经 成 功 地 讨论 了 两 个 相互 独立 的 随机 变量 之 和 的 分 布 . 在 此 基础 上 , 我 
们 来 考察 三 个 或 更 多 个 相互 独立 的 随机 变量 之 和 的 分 布 . 设 X; 是 概率 密度 函数 为 
fx; 的 随机 变量 . 由 定理 10.1.2 可 知 , 如 果 UV 和 是 两 个 相互 独立 的 随机 变量 , 那 
么 furv(z) = (fuxJv)(z). 由 此 能 不 能 求 出 fx 4xs+xs; 或 者 更 一 般 的 xs? 
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答案 是 肯定 的 ! 
定理 10.3.1 (独立 的 随机 变量 之 和 ) 设 Xi, 义 ，… ,X 是 相互 独立 的 随机 变量 ， 
它们 的 概率 密度 函数 分 别 是 fx,, fx,,… , fx,, 那么 
Ja = (Cry 
其 中 
(fx fox * fn)(z) = (fix (far (fn2* (fn-1* fn))..)) (2). 

我 们 已 经 证 明了 卷 积 是 可 交换 的 , 也 就 是 说 f xg = gx 了 . 另外 , 卷 积 还 满足 结 
合 律 : (fx* g)*h = fx*(g* 有 hh). 记 住 , 卷 积 要 用 两 个 函数 作为 输入 , 并 返 世 | 一 个 函数 
作为 输出 . 我 们 不 能 直接 对 三 个 函数 求 卷 积 . 所 以 , 如 果 给 出 了 f*gx*h, 就 要 小 心 


地 解释 这 是 什么 意思 . 因为 卷 积 需要 两 个 输入 , 所 以 这 里 有 两 种 解释 方法 : f * g*h 
等 于 (f *g)*h 或 者 fx (g*h). 地 运 的 是 , 因为 卷 积 满足 结合 律 , 所 以 这 两 个 表达 
式 是 相等 的 , 写 哪 个 都 可 以 . 虽然 我 们 可 以 直接 证 明 结 合 律 , 但 没 必要 这 样 做 . 原 基 


在 于 , 我 们 只 在 乎 关于 概率 密度 函数 的 卷 积 定理 , 而 且 有 个 很 好 的 技巧 能 让 我 们 更 
站 


地 使 用 结合 律 . 
定理 10.3.1 的 证 明 : 我 们 只 考察 人 见 = 3 日 
地 证 明 . 


那么 , 现在 就 来 考察 2 = Xi 十 Xs 十 Xa. 我 们 把 这 个 式 子 写成 Z = (XI 二 X2) 十 


的 情形 , 一 般 情 形 下 的 结果 可 以 类 似 


Xa. 这 样 


做 的 好 处 是 , 对 于 两 个 相互 独立 的 随机 变量 ， 


它们 的 和 的 概率 密度 函数 就 


是 它们 概率 密度 函数 的 卷 积 


. (注意 , 因为 Xs 独立 于 Xi 和 Xo, 所 以 Xs 与 它们 的 


于 是 有 

fz(z) = 
定理 10.1.2 可 知 , fx;+x, = 
fz(2) = ((fxs * fx) 


和 也 是 相互 独立 的 .) 
(fxi+ x 米 fxs)(2). 


现在 ， 


* fxa) (2). 


当然 , 我 们 也 可 以 写成 Z = Xi 十 (Xs 十 X3), 而 不 是 2 = 


这 种 情况 下 , 首先 得 到 的 是 
fz(2) = (fx * fxst+Xs)(2). 
利用 fxs+xs = fxs* fxs, 有 
fz(2) = (fx * (fxs * fxs)) (2). 


fx * fxs. 把 它 代入 上 式 , 就 得 到 了 


(Xi 十 X2) 十 Xa. 在 
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如 果 继 续 沿 着 这 种 思路 论证 下 去 , 就 不 难看 


我 们 甚至 可 


对 于 四 个 相互 独立 的 随机 变量 ， 
率 密度 函数 fx1 * (fx * (fx 党 fxs))- 


以 颠倒 函数 的 次 序 , 比如 Xj 十 Xz 十 X3 = 
可 以 写成 和 


HE 
女 . 


看 出 如 何 对 卷 积 进行 分 组 并 不 重 
Xz 十 Xs 十 X1 (等 等 ). 


F(X 十 (Xs 十 Xs)), 这 会 给 出 概 


上 述 过 程 是 我 最 喜欢 的 论述 之 


vy 
}y 鞋 


意 , 这 里 完全 没有 求 积 分 或 求 和 . 我 们 先 


分 组 ,接着 探讨 了 由 此 带 来 的 结果 , 并 最 终 得 到 了 答案 . 我 把 这 种 方法 称 为 分 组 证 


明 法 , 其 他 相关 示例 , 请 参阅 A.3 节 
回 
地 抛掷 三 颗 仍 子 , 我 们 可 以 求 出 得 到 
山子 所 得 数字 的 概率 密度 函数 ， 所 


做 起 来 难 , 原因 是 这 里 


[ 


子 的 情况 . 
组 方法 . 


考察 


Xi1 十 (Xz 十 (Xs 十 X4)). 为 什么 这 种 做 法 
也 不 对 ! 再 看 一 下 第 二 种 


不 是 吗 ? 是 的 , 但 


颗 人 般 子 的 好 处 在 于 , 我 们 
更 好 的 解决 方案 是 将 四 个 变量 分 组 为 (X 


EE 会昌 


到 10.2 节 的 般 子 问题 . 接 下 来 的 问题 将 


会 展示 一 个 真正 的 精彩 视角 . 独立 


数字 的 PDF. 我 们 知道 掷 一 颗 仙 子 以 及 掷 两 颗 
以 现在 只 需要 求 出 卷 积 . 
的 代数 运算 有 些 杂乱 . 
我 们 把 抛 撕 三 颗 骨 子 的 头痛 问题 留 给 你 自 


遗憾 的 是 , 说 起 来 容易 


己 来 解决 , 现在 继续 考虑 掷 四 颗 盘 


刀 


可 以 采用 另 一 种 还 没 


好 呢 ? 现在 


pa 


几 右 


被 提 到 过 的 分 
(X3 十 X4), 而 不 是 
仍然 要 进行 三 次 加 法 运算 
(区 二 六 二 人 5 起 注 


1 二 Xz) 十 


意 , 第 一 个 加 法 和 最 后 一 个 加 法 是 相 
于 /xx = fxs* fxs. 所 以 ， 
两 次 是 相同 的 . 这 远 好 于 Xi 十 (Xz 十 
完全 不 同 的 加 法 运算 . 


虽然 从 技术 上 看 
(CXs 二 X4)) 的 分 组 方式 ， 


函数 fxi+x2 = fx 四 fx 就 等 
要 进行 三 次 加 法 运算 , 但 其 中 
因为 后 者 涉及 三 个 


如 果 考 察 八 个 相互 独立 且 
和 可 以 写成 


总 


((X1 1 


X2) + (X3+ X4)) 十 ((X5 


同 分 布 的 随机 变量 的 和 , 这 种 优势 就 更 明显 了 . 这 个 


从 而 减少 大 量 运 算 . 两 个 变量 的 加 法 
把 两 个 结 


要 进行 四 次 , 然后 把 得 
吉 果 相 加 . 换 名 话说 , 我 们 要 计算 三 种 不 同 的 卷 积 , 但 是 如 果 采 


X6) + (X7 + Xs)), 


到 的 和 相 加 两 次 , 接着 
用 下 列 分 


组 方式 
Xi 二 (Xo 二 + (X3+ (Xa+ (Xs 
就 必须 算出 七 个 不 同 的 卷 积 . 这 显然 没有 第 


从 某 种 意义 上 说 , 上 述 启示 并 不 


用 巧妙 的 分 组 方法 , 我 们 也 可 以 算出 PDF, 但 


EE 要 , 但 


(Xe + (X7 + Xs)))))), 


一 种 分 组 方式 好 . 
这 种 观点 是 不 正确 的 . 没 错 , 如 果 不 使 


这 只 会 增加 麻烦 . 我 的 人 生 目 标 之 一 


"NES 


就 是 尽量 减少 烦琐 乏味 的 代数 运算 . 分 组 是 一 种 很 好 的 方法 , 可 以 让 代数 运算 更 容 


易 处 到 


为 了 看 出 这 一 点 , 我 们 来 考察 独立 地 抛 扼 四 颗 骨 子 所 得 至 


Xs、 Xa 和 和 分 别 表示 


到 的 数字 之 和 . 让 Xi1、 


示 这 四 颗 骨 子 掷 出 的 数字 . 我 们 知道 这 几 个 变量 服从 的 分 布 ， 
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还 知道 Xi 二 Xs。 和 Xs 十 Xs4 的 概率 密度 函数 
4 一 工 


有 vef{2 人 


fxi+xa(u) 一 fxs+xalu) 一 若 UE {7 Te ,12} 


0 其 他 . 
现在 就 可 以 计算 掷 出 的 数字 之 和 为 4,5,6,… ,24 的 概率 . 
设 Z= XiX2 + Xs 十 及 4， 我 们 有 fz(2) 一 (xz 水 fxs+xXa)(2), 其 中 ， 对 
等 号 右 端的 两 个 非 0 的 概率 密度 函数 , 它们 的 输入 都 只 能 是 介 于 2 和 12 之 间 的 
值 . 例如 


12 
fz(6) = pb fx1+ Xs (k)fxs+xa(6 一 k) 
=2 


4 
= >》， fxi+ Xs (k)fxs+xa(6 一 k) 

= 多 
_2-14-1 3-13-1 4-12-1 10 5 
36 36 36 36 36 36 1296 648° 


类 似 地 , 我 们 还 能 求 出 其 余 20 个 函数 值 . 这 比 把 64 = 1296 种 可 能 的 结果 全 都 写 出 


来 要 好 得 多 . 图 10-3 显示 了 其 结果 . 


入 


5 10 15 20 
图 10-3 ”独立 地 抛 绑 四 颗 均 匀 的 人 般 子 , 得 到 的 数字 和 的 概率 密度 函数 


如 果 你 听 说 过 中 心 极限 定理 , 那 就 透 过 它 看 看 图 10-3 一 一 你 应 该 能 开始 看 到 
钟 形 曲线 , 或 者 开始 想到 高 斯 分 布 了 . 


10.4 ”变量 替换 公式 : 叙述 


现在 转向 本 章 的 第 二 个 主题 . 在 第 一 部 分 中 , 我 们 求 出 了 相互 独立 的 随机 变量 
之 和 的 概率 密度 函数 , 它 可 以 用 各 变量 的 概率 密度 函数 来 表示 . 现在 来 看 一 下 , 随 
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机 变量 的 概率 密度 


函数 之 间 存 在 的 一 种 非常 好 的 依赖 关系 . 我 们 的 主要 研究 工具 是 


变量 替换 公式 . 这 是 微 积分 中 最 重要 的 定理 之 一 . 当 只 有 一 个 变量 时 , 它 实际 上 就 
是 链 式 法 则 ; 当 涉 及 多 个 变量 时 , 情况 就 变 得 更 复杂 了 . 现在 只 考虑 涉及 一 个 变量 


的 概率 密度 函数 , 因此 我 们 会 搁置 更 一 般 的 情况 . 如 果 有 兴趣 , 你 可 以 查阅 在 线 补 
明 与 更 多 例子 . 


充 资料 来 获得 其 证 
接 下 来 要 说 的 


的 概率 密度 函数 是 fx， 如 果 9 是 一 个 “合适 的 ”函数 ,那么 我 们 肯定 能 外 


是 一 种 


很 常见 的 情况 .假设 我 们 有 一 个 连续 型 随机 变量 X, 它 
求 


AN 


出 甘 


人 


多 
Y = g(X) 的 概率 密度 函数 , 而 结果 应 该 包含 了 fx 和 9 的 组 合式 . 变量 替换 


将 告诉 我 们 这 种 关系 是 什么 , 并 指出 哪些 9 是 “合适 的 ”. 


定理 10.4.1 (变量 替换 公式 ) 设 X 是 一 个 概率 密度 函数 为 fx 的 连续 型 随机 
变量 , 并 设 存在 一 个 区 间 TC 民 使 得 当 x 4 了 时 , fx(x) = 0 ( 换 白 话说 ,和 只 
有 在 了 中 取 值 时 , 其 概率 密度 函数 才 可 能 不 为 0, 其 中 了 可 以 是 整个 实 直线 ). 设 
9 :一 民 是 一 个 可 微 函数 , 其 反 咏 数 是 h. 除了 在 有 限 多 个 点 处 的 导数 值 可 能 
为 0 外 , 9 的 导数 在 了 中 始终 为 正 或 者 始终 为 负 . 如 果 令 Y= g( 义 ), 那么 


fy(y) = fx(h(Y)) IR. 


在 给 出 定理 的 证 明 前 , 我 们 先 讨论 一 下 它 的 意思 是 什么 , 并 考察 一 个 例子 , 而 
它 的 证 明 会 放 在 本 节 的 最 后 . 当 我 们 看 到 证 明 后 , 定理 中 的 一 些 条 件 (尤其 是 可 微 


。 首先 , X 定义 和 


性 的 条 件 ) 会 变 得 更 加 清晰 
上 面 说 了 很 多 内 容 , 我 们 来 慢 慢 地 解析 . 
不错 的 区 间 上 . 虽然 工 可 能 是 整个 实数 集 R, 但 它 通常 是 
RR 的 一 个 子 集 . 引入 这 个 小 区 间 的 原因 是 , 要 想 求 出 fy, 函数 g 就 必须 满足 


人 
儿 个 好 的 性 质 . 通过 把 研究 范围 在 T 上 , 我 们 只 需要 让 9 在 工 上 具有 民 好 
的 性 质 , 而 不 必要 求 在 整个 民 上 有 民 好 的 性 质 . 
其 次 , 我 们 希望 g 是 可 微 的 . 这 个 限制 并 不 可 怕 , 大 多 数 常见 变换 都 是 可 微 


的 , 但 并 非 全 部 如 出 
变量 , 那么 9(X) = |X| 就 不 满足 要 求 , 因为 绝对 值 函 数 在 原点 处 是 不 可 币 


的 . 但 是 , 如 果 了 = [2,3], 就 可 以 取 g(X) = |X|. 


k. 例如, 如 果 让 X 表示 定义 在 区 间 工 = [1,1] 上 的 随机 


。 最 后 一 个 条 件 要 求 g 的 导数 要 么 始终 为 正 , 要 么 始终 为 负 . 这 意味 着 g 要 


么 严格 地 增加 (如 果 导 数 是 正 的 ), 要 么 严格 地 减少 (如 果 导 数 是 负 的 )， 因 
此 , X 的 每 个 值 都 只 与 唯一 的 Y 值 相关 联 , 反之 亦 然 如果 导数 在 几 个 点 
处 是 不 存在 的 , 该 怎么 办 呢 ? 这 并 不 重要 , 只 要 导数 在 这 些 点 之 前 和 之 后 都 
上 其 有 相同 的 符号 , 那么 函数 仍然 是 严格 增加 或 严格 减少 的 . 例如 , 考虑 定义 
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在 


[一 1,1] 上 的 函数 g(z) = z3. 注意 , g(xz) = 37z2， 
z= 二 0 之 外 的 所 有 点 处 始终 为 
仍然 是 严格 增加 的 . 


E, 但 在 z=0 处 不 存在 . 


回顾 一 


下 ,如果 h 是 g 的 反 函 数 , 那么 


h(g(7x)) = x 并且 


这 表明 了 g/(z) 在 除了 点 


函数 9 在 [-1,1 上 


9(h(y)) = y. 利用 


链 式 法 则 , 我 们 发 现 g 和 h 的 导数 之 间 有 很 好 的 关系 . 求 函数 


g(h(y)) =Y 


关于 y 的 微分 , 我 们 得 到 了 


或 者 


9 (h(Y)) :RY)=1, 


1 


人 二 


因此 , 如 果 知 道 9 


就 可 以 利用 g' 来 丰 


的 具体 表达 式 并 进行 微分 会 更 容易 些 , 但 是 


是 如 


果 上 h 


的 导数 , 那么 就 知道 h 的 导数 . 在 实践 中 , 有 时 直接 求 h 
的 微分 算 起 来 非常 暴 烦 ， 


定 jv. 注意, 不 管 怎样 和 有 


要 求 我 们 算出 fx 在 h(y) 处 的 值 . 


三 


最 后 来 验 
的 
也 是 负 的 . 如 果 息 
负 值 


证 这 个 公 


被 映射 成 [g(a), g( 


(最 后 
Fx(b)=1 


有 Fx(a 


E 负 函数 . 我 们 看 到 这 上 
! 为 外 , 我 们 还 要 


正 的 情况 , 所 以 现在 可 
b)], 


一 个 等 式 利用 了 “Fx 是 XX 的 CDF” 这 一 事实 . 因 


式 是 否 合理 . 最 简 


的 方法 是 看 它 是 不 是 


实 需要 求 出 函数 h, 因为 公式 


个 积分 值 


为 1 


的 绝对 值 


人 


符号 是 必要 的 . 如 果 9 是 负 的 , 那么 以 


了 考虑 绝对 
前 保 其 积分 值 
以 把 绝对 值 


于 是 


是 1. 为 了 方便 起 见 , 我 们 只 
符号 去 掉 . 在 这 种 情况 下 , 区 1 


值 , 那么 Y 的 概率 密度 函数 会 在 某 些 点 处 取 


考虑 jv 是 
日 了 = [ay 


为 a< < 5b, 所 以 


) = 0). 因此 , 这 个 函数 的 积分 值 确实 是 1. 当 9 取 负 值 
时 , 计算 方法 是 类 似 的 , 但 现在 了 = [a,9] 被 映射 成 了 [g(0), g(a)], 这 是 因为 
所 以 次 序 会 颠倒 过 来 . 


9 是 一 个 递减 函数 ， 
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我 们 看 一 个 例子 . 不 妨 设 X 的 概率 密度 函数 是 
1/2 若 0<z<2 
2 | 0 其 他 ， 
并 设 
g(X) = X2. 
看 看 下 列 叙述 . 


(1) 区 间 工 就 是 [0,2]. 

(2) g(z) = z2 的 导数 就 是 g(xz) = 2z. 除了 z = 0 之 外 , 9 在 其 他 点 处 的 函数 
值 均 为 正 . 

(3) 由 于 h(g(x)) = Vz2 = z 并 且 g(h(y)) = (VD)? =y, 因 此 9 的 反 函 数 就 是 
h(y) = Vy. 记 住 , 考察 的 区 间 是 [0,2], 所 以 只 取 正 的 平方 根 . 

(4 由 hy) = Vy 可知, WV(y) = -42. 另 一 种 思路 是 , 因为 六 (y) = 1/g(h(y)) 
且 g(z) = 22, 所 Wy) = $y 22. 

现在 , 我 们 利用 变量 替换 公式 来 求 


fr(y) = fx(1(9)) | 天 (| 
2 时 , 有 fx(w) = 0, 而 且 hly) = Vy， 所 以 , 如 果 y 不 满足 


< 
< 


< vy <2,R y < 4, 那么 应 (y) = 0， 对 于 这 样 的 y, fx(nh(y)) = 1/2 且 
p(y) = 1/2Vy. 综 上 所 述 , 我 们 得 到 了 
1 六 
右 0O<y<4 
fy(y) = | 4 
0 其 他 . 


作为 检验 , 我 们 要 确保 上 述 概率 密度 函数 的 合理 性 . 它 显 然 是 非 
积分 值 是 否 为 1? 因为 该 函数 在 0 和 4 之 间 的 取 值 不 为 0, 所 以 只 需要 求 出 0 到 4 


上 的 积分 . 7 
4 4 dy VY 
dy = Sh ey Ye 
[ fy(y)dy 大 万 
可 以 看 到 其 积分 值 确实 等 于 1. 当然 , 这 并 不 能 证 明 我 们 的 代数 运算 是 正确 的 , 但 
这 能 让 我 们 打消 疑虑 . 
F 面 的 答案 很 有 意思 . 最 初 的 概率 密度 函数 在 任意 一 点 处 都 表现 良好 , 映射 函 
数 g(xz) = x? 也 是 个 不 错 的 函数 , 但 是 新 随机 变量 Y = g(X) 的 概率 密度 函数 却 在 
y = 0 处 趋 近 于 无 穷 大 ! 虽然 这 看 起 来 很 奇怪 , 但 它 与 我 们 的 理论 并 不 矛盾 . 注意 ， 
非常 重要 一 点 是 , 概率 密度 函数 fy 在 原点 处 是 “ 弱 ” 无 穷 大 . 也 就 是 说 , 当 


注 
全 
| 
去 
N 
y 

4 


= 可 


和 
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时 , 尽管 它 会 增加 到 无 穷 大 , 但 会 以 非常 缓慢 的 速度 增加 ,从 而 使 最 终 的 积分 仍 是 
有 限 的 . 


10.5 ”变量 替换 公式 : 证 明 


现在 来 看 变量 替换 公式 的 证 明 . 其 主要 思想 是 使 用 累积 分 布 函数 . 这 是 一 种 很 
好 的 证 明 方法 , 我 们 给 该 方法 取 个 (相当 明显 的 ) 名 称 : 累积 分 布 函数 法 . 

变量 替换 公式 的 证 明 : X 是 定义 在 区 间 T 上 且 概 率 密度 函数 为 fx 的 随机 变 
量 . Y = 9(X), 这 里 的 g(z) 是 一 个 函数 , 其 导数 始终 为 正 (除了 有 限 多 个 点 以 外 )， 
反 函 数 是 hh (所 以 g(P( 人 = 且 h(g(x)) = x). YY 的 累积 分 布 函 数 户 是 Y<y 的 
概率 , 而 Y 的 概率 密度 函数 就 是 累积 分 布 函数 的 导数 . 因此 , 如 果 能 找到 Fy 并 求 
出 它 的 微分 , 就 能 知道 概率 密度 函数 方 -. 
在 证 明 过 程 中 , 我 们 很 容易 犯错 , 所 以 要 慢 慢 来 , 把 每 个 细节 都 考虑 到 .假设 
区 间 是 了 = [a,0], 那么 X < z 就 变 成 了 ua 乏 X 和 zz 想 一 下 ,在 9 的 作用 下 , 区 
间 Z 是 如 何 被 映射 的 . 我 们 有 a 一 g(a) 和 br 9( 亿 .你 可 能 会 认为 区 间 工 被 映射 
成 了 [g(a),g(b)], 但 这 可 能 是 错误 的 ! 如 果 9 是 正 的 , 那么 这 个 结论 一 定 成 立 , 因 
为 此 时 9 是 个 递增 函数 . 但 是 , 如 果 g' 是 负 的 , 那么 9 就 是 个 递减 函数 , 此 时 有 
g(b) < g(a). 在 这 种 情况 下 , 了 会 被 映射 成 [g(5),g(a)]. 这 就 是 变量 蔡 换 公式 中 使 用 
绝对 值 的 原因 . 

情形 1: 先 假设 yg 是 正 的 , 所 以 工 被 映射 成 [g(a),g(b)]. 那么 , 由 g(a) < g(X) < 
y 等 价 于 a < g-1(g(X)) < g-1(y) 可 知 


因为 函数 g-! 可 以 用 h 来 表示 , 所 以 这 个 条 件 就 变 成 了 a < XX < h(y). 如 果 g 没 
有 一 个 好 的 反 函 数 , 我 们 就 无 法 继续 这 个 论证 . 在 证 明之 后 , 我 们 会 给 出 更 多 相关 
注释 . 现在 继续 下 去 , 有 


Fy(y) = Prob(la < X < h(y)) 
= Fx(h(y)) (利用 了 Fx 的 定义 ). 
利用 链 式 法 则 以 及 F% = fx, 通过 微分 求 出 fy. 于 是 


fy(y) = Fx(h(y)) :p(yY) = fx(h(W)) RY). 
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因为 x 和 g' 的 符号 相同 , 所 以 jv 是 正 的 , 上 式 可 以 写成 
fy(y) = fx(h(y)) :RW. 


2: 现在 假设 g 是 负 的 , 所 以 工 被 映射 成 [g(b),g(a)]. 此 时 , Y < y 就 变 成 
了 g(b) <Y<y, 并 且 有 


里 利用 了 g(5) < g(X) < y 等 价 于 gi(y) < g 1(g(XX)) < 5. 次 序 为 什么 颠倒 了 ? 
对 是 9 为 递减 函数 , 而 g-! 也 是 如 此 . 当 9 或 g-! 发 挥 作用 时 , 次 序 就 要 颠倒 过 
和 之 前 一 样 , 用 h 来 表示 函数 g-1, 那么 上 面 的 条 件 就 变 成 了 h(y) < XX<5b. 继 
进行 下 去 , 就 得 到 了 


洲 洲 洱 议 


b) — Prob(la < X < h(y)) 
二 1 一 Fx(h( 办 ) (利用 了 Fx 的 定义 ). 


利用 链 式 法 则 以 及 FX = fx, 通过 微分 求 出 fy. 于 是 


fy(y) = 一 ER) 天 (人 = fx(hW)) KY); 


但 是 , 因为 n* 和 g' 的 符号 相同 , 所 以 jr 是 负 的 . 因此 , -大 (9) = | (y)|, 这 样 就 得 
到 了 


fy(y) = fx (hy)) Ir (|. 
注意 , 这 与 第 一 种 情形 的 结果 完全 相同 . 
因为 这 个 证 明 很 长 , 所 以 有 必要 回 过 头 来 慢 慢 消化 吸收 . 这 里 有 几 点 值 


得 强调 . 
。9' 取 负 值 的 情况 处 理 起 来 很 烦人 , 但 它 在 本 质 上 与 g' 为 正 的 情形 是 一 样 的 . 
主要 思想 是 , 把 Y 的 累积 分 布 函数 表述 成 另 一 个 与 X 的 累积 分 布 函数 有 关 
的 结论 . 

简单 地 解释 一 下 , 为 什么 9 是 一 对 一 的 映 上 函数 会 如 此 重要 . 假设 g(X) = 
X? 定义 在 T= [11 上. 此 时 , 区 间 [1,1] 的 两 个 端点 被 映射 成 了 同一 个 
点 , 即 1! 这 将 导致 在 一 个 点 上 积分 , 而 在 一 个 点 上 的 积分 就 等 于 0. 还 有 另 
外 一 种 思路 . 为 了 得 到 反 函 数 , 对 于 任意 给 定 的 输入 , 它 应 该 只 有 唯一 的 逆 
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或 和 = -1/2. 具有 当 9 是 一 对 
如 果 仔 细 看 这 个 证 明 , 你 可 能 会 注意 到 它 缺 少 了 一 些 东 西 .和 


用 会 六 


在 这 种 情况 下 , 如 果 试 着 从 9(X) = 1/4 入 手 往 回 找 , 那 就 会 得 到 X = 1/2 
一 的 映 上 函数 时 , 才能 保证 一 


定 存在 反 冰 数 . 
的 累积 分 布 函 


数 Fx 在 论证 中 发 挥 了 重要 作用 , 但 我 们 并 没有 把 它 明 


地 写 出 来 . 为 什么 


呢 ? 一 旦 出 现 了 Fx, 我 们 就 立即 求 它 的 微分 , 进而 得 到 
的 . 记 住 , 积分 很 难 
见 . 所 以 , 这 里 
最 后 , 总 结 一 下 使 


fx. 


六 ?二 2 二 


吊 乎 和 过， 


` 需 要 写 出 Fx 的 表达 式 真 的 非 
用 变量 符 换 公式 的 过 程 . 


这 是 非常 幸运 


计算 ! 函数 的 积分 是 个 漂亮 的 解析 表达 式 的 情况 非常 罕 


累积 分 布 函数 法 : 设 X 是 一 个 概率 密度 函数 为 fx 的 随机 变量 , 其 中 fx 在 区 


闻 了 上 不 为 0. 设 Y ==g(X), 这 里 的 g:7 一 民 是 可 微 函 数 , 它 的 反 
了 有 限 多 个 点 之 外 , 假设 9 的 导数 在 了 
处 , g' 可 能 不 存在 . 为 了 求 出 概率 密度 函数 户 , 需要 如 下 操作 . 
(1) 确定 随机 变量 X 有 定义 的 区 间 工 
(2) 证 明 函 数 g 有 一 个 始终 


上 始终 为 正 或 始终 为 负 . 在 这 有 限 多 个 点 


为 正 或 始终 为 负 的 导数 (当然 , 除了 有 限 多 个 


函数 为 h. 除 


可 能 的 点 之 外 ). 
(3) 求 出 反 函 数 h(y), 其 中 g(h(y)) = vy 且 h(g(z))=z. 
(4) 求 出 jr()， 既 可 以 直接 对 h 求 微分 ， 也 可 以 利用 关系 式 jr(y) = 


1/g9'(h(Y)). 
(5) Y 的 概率 密度 函数 为 fy(y) = fx(n(y))I(y) 


在 应 用 方面 , 有 时 候 最 好 不 要 死记 公式 (比如 变量 替换 公式 ), 而 要 记 住 它 的 思 
路 , 并 在 实际 应 用 时 重新 把 它 推导 出 来 . 
例如 , 我 们 看 一 下 前 面 的 例子 
1/2 大 0<zx<2 
人 其 他 . 
注意 , 其 累积 分 布 函数 是 
0 若 zx<0 
Fx(7x)= $4 2/2 若 0<xz<2 
1 若 z>2， 
如 图 10-4 所 示 . 对 fx 求 积分 就 可 以 得 到 Fx. 另外 , 我 们 还 想 知道 Y = g(X) 的 


分 布 情况 , 其 中 g(X) = X?. 下 面 给 出 男 一 种 计算 方法 . 
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图 10-4 ”累积 分 布 函 数 Fx (zx) 


先 求 出 YY 的 CDF, 然后 通过 微分 求 出 Y 的 PDF.y<0 和 yz 4 时 的 CDF 
很 容易 计算 : y < 0 时 的 CDF 是 0, y > 4 时 的 CDF 是 1. 因此, 我 们 集中 考察 
0<<y<< 4 时 的 情况 , 此 时 


( 
= Prob(X? < vy) 
=Prob(~Vy < X < VY 
二 Prob(0 < 针 < Vy) 因为 和 是 非 负 的 
= Fx (VD). 


从 这 里 开始 , 可 以 采用 两 种 方法 . 因为 我 们 知道 X 的 CDF, 所 以 Fx (Vy) 可 
以 替换 成 yy/2. 于 是 , 当 0< vy<4 时 ,有 


yy(W) = 并， 这 意味 着 fy(y) 


”， 直 
4VY 


注意 , 这 与 在 10.4 节 得 到 的 结果 是 一 样 的 . 
此 外 , 如 果 不 把 X 的 CDF 写 出 来 , 也 可 以 利用 链 式 法 则 求 导 , 那么 当 0 < y < 1 
时 , 有 


如 图 10-5 所 示 . 
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0.8r 
0.6[ 


0.4r 


SE y 
0.2 0.4 0.6 0.8 1.0 


图 10-5 0<y <1 时 的 概率 密度 函数 fy(y) 


我 们 得 到 了 与 之 前 一 样 的 答案 . 如 果 记 住 了 这 个 公式 , 那 你 就 能 马上 得 出 答案 . 
这 很 好 , 而 且 计 算 速 度 也 更 快 , 却 始终 存在 无 法 理解 的 危险 . 我 们 不 应 该 只 记 住 
式 , 还 要 记 住 公式 为 什么 成 立 . 这 就 是 记 住 “从 CDF 中 可 以 求 出 PDF” 会 让 事情 
变 得 更 简单 的 原因 : 每 当 需 要 它 时 , 你 都 能 重新 推导 出 变量 蔡 换 公式 . 


累积 分 布 函数 法 (替代 形式 ): 设 X 是 一 个 概率 密度 函数 为 fx 的 随机 变量 , 并 
设 工 = g(X), 其 中 9 是 可 微 函数 . 为 了 方便 起 见 , 不 妨 设 g(z) > 0. 为 了 求 出 
应 , 需要 如 下 操作 . 
(1) 用 XX 和 g 来 表示 Y 的 CDF: Fy(y)= Prob(Y < y)= Prop(g(X) < Vy). 
(2) 通过 逆 运算 , 把 涉及 9(X) 的 不 等 式 替 换 成 与 X 有 关 的 不 等 式 . 例如 , 可 
能 有 一 个 隐 含 条 件 9g(X) > 0, 由 此 可 得 Fy(y) = Prob(g-1(0) < 和 去 
g (9) = Fx(g™ (Y)) — Fx(g™ (0)). 
(3) 利用 链 式 法 则 求 导 : fy(y) = fx (g-1(Y)) 名 9g- 1(y). 


dyy 
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到 目前 为 止 , 我 们 已 经 讨论 了 随机 变量 的 和 与 差 . 当然 , 数量 的 组 合 方式 还 有 
很 多 种 , 比如 乘法 和 除法 . 对 于 相互 独立 的 随机 变量 X 和 YY 而 言 , XY 和 X/Y 的 
概率 密度 函数 能 否 用 X 和 的 概率 密度 函数 来 表示 ? 

答案 是 肯定 的 , 原因 就 在 于 巴 甫 洛 夫 反射 : 每 当 看 到 乘积 (或 商 ) 时 , 就 应 该 
对 数 . 因此 , 我 们 不 需要 研究 XY, 而 是 研究 UV, 其 中 UV= logX,V=logY ( 
的 情形 与 之 相似 ). 换 句 话说 , 从 某 种 意义 上 看 , 没 必 要 建立 乘积 理论 , 因为 求生 
论 与 变量 替换 可 以 推导 出 我 们 想 要 的 一 切 . 但 是 , 总 结 出 一 种 特殊 情况 下 的 公式 ; 
常 比 来 回 换算 更 容易 些 . 因此 , 在 接 下 来 的 几 小 节 中 , 我 们 会 分 析 一 般 的 理论 , 3 


型 到 


[El 
[=| 


(型 


dk 
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察 一 两 个 例子 . 


10.6.1 “乘积 的 概率 密度 函数 


设 X 和 站 是 相互 独立 的 非 负 随机 变量 , 它们 的 概率 密度 函数 分 别 是 fx 和 fy， 
累积 分 布 函 数 分 别 是 Fx 和 By. 设 Z = XY, 那么 


= {fxd 
t=0 


上 上面 这 个 公式 与 两 个 独立 的 随机 变量 之 和 的 概率 密度 函数 公式 非常 相似 . 
和 的 概率 密度 函数 公式 中 , 因为 t 与 z 一 t 的 和 等 于 z, 所 以 我 们 计算 了 + 上 和 > 一 
处 的 概率 密度 , 然后 对 dt 进行 积分 . 这 个 公式 的 区 别 在 于 , 我 们 要 对 dt/t 进行 各 
分 , 而 不 是 dt. 这 背后 涉及 很 多 深层 次 理论 . 简单 地 说 , dt 在 加 法 变换 下 保持 不 变 
(如 果 w==t 十 a, 那么 dw = d), 而 dt/t 在 乘法 变换 下 保持 不 变 (如 果 w = az 为 
么 dw/w = dt/t). 

采用 与 之 前 类 似 的 论证 方法 来 说 明 这 个 公式 为 什么 成 立 ， 现在 仍然 从 定义 
台 . 注意 , 为 了 简化 积分 上 下 限 , 不 妨 设 关 和 YY 都 是 非 负 的 (这 样 就 不 必 担 心 两 个 
负数 的 乘积 会 变 成 正 数 的 问题 ). 


Pi 
Mm 


Io 


ro 


Fz(2) := Prop(Z < 2) 


I fx(r)fy (ydydz 


= rame 站 -有 Oldz 
ee 
二 六 四 王 本 (zjajdz 
we 


= /mopeja 


把 积分 中 的 虚拟 变量 x 换 成 志 就 得 到 了 结论 . 
警告 : 必须 证 明 积分 运算 和 求 导 运算 可 以 交换 次 序 . 
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10.6.2 ” 商 的 概率 密度 函数 


设 X 和 Y 是 相互 独立 的 非 负 随机 变量 , 它们 的 概率 密度 函数 分 别 是 fx 和 fy， 
累积 分 布 图 数 分 别 是 Fx 和 Fy. 设 Z = X/Y, 那么 


fz(2) = 闻 ? /mhrlejaada 


孙 


这 里 的 证 明 与 前 面 非常 相似 . 之 所 以 介绍 这 个 证 明 是 因为 它 提供 了 探讨 这 种 
方法 的 男 一 个 机 会 . 首先 ， 一 个 很 大 的 不 同 是 积分 限 


Fz(z) = Prob(Z < 2z) 


- pe y)dydz 
z=0 we 


和 x(n | Fy(00) — Fy (zx/2)] dz 


下 一 个 
fz(z) = | fx(z)[l— Fy(z/z)| dz 
-三 专区 


CF (Z/z)dz 


| 


we 


一 2 一 2 / xzZ)Pr(z/ zzdzi 


把 积分 中 的 虚拟 变量 x 换 成 t, 就 得 到 了 结论 
毫 不 奇怪 , 乘积 的 概率 密度 与 商 的 概率 密度 是 紧密 相关 的 . 
10.6.3 ”例子 : 指数 分 布 的 商 


F 面 的 例子 引出 了 一 个 非常 惊人 的 结果 . 给 定 入 > 0, 设 X,Y ~ Exp() 是 两 
个 相互 独立 的 随机 变量 , 它们 都 服从 指数 分 布 (所 以 , 当 t 不 取 负 数 时 , 它们 的 概率 
密度 都 是 和 -1exp( 一 t/ 和 ); 否则 , 概率 密度 就 是 0. 关于 指数 分 布 的 更 多 内 容 , 请 参 
阅 第 13 章 ), 并 设 2 = X/Y. 利用 10.6.2 节 的 结果 , 可 以 求 出 2 的 概率 密度 函数 : 


访 ( 动 三 2 oy fx(t)fy(t/z)tdt 
= 和 2 人 exp (—t/M) exp (一 (t/2)/A)tdt 
二 


一 入 22 小 exp(—t/(A(1 + 1/z2)- 1))tdt, 
t=0 
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其 中 , 关于 指数 运算 的 最 后 一 步 简化 利用 了 
t t/z _ t(1+1/z) t 


入 A 入 A(l1+1/z)-! 
我 们 把 式 子 写 成 这 种 形式 是 因为 现在 可 以 把 被 积 函数 看 成 一 个 服从 指数 分 布 
的 随机 变量 , 这 个 指数 分 布 的 参数 就 是 
w = A(l1+1/z)-! 


于 是 , 把 上 式 乘 以 w/w = 1 就 得 到 了 (此 时 的 积分 是 一 个 随机 变量 的 均值 , 而 这 个 
随机 变量 服从 参数 为 w 的 指数 分 布 ) 


fz(2) = A 和-22-2 a tL exp(-t/o)dt 
t= 


最 后 一 个 积分 可 以 用 分 部 积分 法 来 计算 . 我 们 会 在 第 13 章 中 看 到 , 如 果 一 个 随机 
变量 服从 参数 为 w 的 指数 分 布 , 那么 它 的 均值 就 等 于 w. 把 这 个 结果 代入 上 式 可 得 
fz =A 2 2 = (41/2) 2 = ee (10.1) 
上 面 的 答案 有 很 多 吸引 人 的 特征 . 最 重要 的 一 点 是 它 与 指数 分 布 的 参数 和 无 
关 ! 这 看 起 来 让 人 感到 震惊 是 不 是 出 错 了 ? 我 们 快速 地 检验 一 下 . 这 个 函数 
显然 是 非 负 的 : 它 的 积分 值 是 否 为 1? 是 的 , 因为 


5 dz du 111 
二 二 一 一 1. 10.2 
| (1 二 +2)? 小 2 让 。 ) 


因此 , 我 们 的 答案 起 码 是 个 概率 密度 函数 . 
我 们 可 以 尝试 一 些 模拟 来 看 看 答案 是 否 依赖 于 入. 这 里 有 一 些 简单 的 代码 , 可 
以 模拟 大 量 比值 并 算出 样本 的 均值 . 


ratioexp[lambda_, num_] := Module[{}, 
sum = 0; 
For[ln = 1, n <= num, n++, 
{ 


x = Random[ExponentialDistribution[lambdal]]; 
y = Random[ExponentialDistribution[lambdal]]; 
sum = Sum + (x/y); 
}]; 
Print["Average is ", sum/nunm]; 
]; 
对 于 不 同 的 和 , 通过 运行 上 述 代码 得 到 大 量 ( 数 十 万 到 数 百 万 ) 的 比值 . 这 段 代 
码 给 出 了 相当 一 致 的 答案 , 但 并 非 绝 对 一 致 . 你 是 否 会 感到 惊讶 : 有 时 某 些 模拟 与 
其 他 模拟 差别 很 大 ? 


题 313 


本 章 关 汶 


换 , 让 我 们 能 够 快速 且 


我 最 喜欢 的 是 不 需要 求 
求 微分 , 这 相 
在 乎 具体 形式 ! 


的 是 概率 论 


10.7 


另 一 种 情况 是 , 一 个 
还 处 到 


了 随机 变量 的 乘积 


的 
LA 


FP 的 一 个 基本 问题 ; 如 何 利用 较 简 单 的 随机 变量 来 到 
杂 的 随机 变量 ? 我 们 看 到 , 这 类 问题 的 处 
[轻松 地 解决 问题 . 
的 概率 密度 函数 时 , 我 们 最 终 看 到 了 累积 分 布 函数 的 一 个 实际 应 有 


旧 


| 


里 方式 有 两 种 . 第 二 种 方式 是 利 
实 上 , 在 利用 fx 和 9 来 寻找 Y= g(X) 


结 


一 口 


EE 
用 变量 


音 复 


蔡 


上 


. 对 于 这 种 方法 ， 


H CDF, 即 Fx. 只 要 知道 Fx 是 存在 的 误 
就 得 到 了 fx. 这 是 最 好 的 纯 数学 一 一 我 们 只 需要 知道 存在 性 , 而 不 


该 定 到 


们 会 看 到 , 写 出 这 些 和 式 
主题 有 很 多 共同 之 处 . 我 
它 的 一 般 公式 就 够 了 , 即 


立 的 随机 变量 之 和 ”, 那么 在 
洛斯 “威廉 斯 文选 》, 1954 年 ) 是 非 
旋 中 , 我 们 才能 找到 方向 . ” 


日 


. 具有 在 风暴 本 身 的 


FE 这 


有 引用 


7 
TT 


卷 积 可 以 很 好 地 处 理 


i 够 了 , 接着 对 它 


随机 变量 是 某 些 相互 独立 的 随机 变量 之 和 (另外 , 附录 中 
与 商 ). 概率 论 中 的 许多 内 容 者 
描述 了 更 多 独立 同 分 布 的 随机 变量 之 和 的 极限 怕 
的 精确 表达 式 会 迅速 变 难 . 幸运 的 是 , 这 与 本 章 上 
门 再 次 面临 这 样 的 状况 : 只 需要 知道 茶 件 事 的 存在 ; 
起 来 并 不 是 特别 有 用 . 如 果 把 “时 间 ” 替 换 成 “ 独 


b 在 为 中 心 极限 定理 做 准备 ， 


E 质 . 这 种 情况 极为 常见 . 我 
的 另 一 个 
E 性 以 及 


威廉 ” 卡 洛 


威廉 斯 的 名 言 (《 威 廉 卡 


恰当 的 :“ 时 1 


随机 变量 之 和 . 在 讨论 中 心 极限 定理 的 订 


人 A 二 


司 是 一 场 风 暴 , 我 们 都 迷失 在 其 


人 


E 明 时 (第 20 章 )， 


F 领 后 


我 们 才能 真 了 
点 . 


习题 10.8.1 
Y 的 概率 密度 函 
习题 10.8.2 
次 、3 次 和 4 


次 


10.8 


给 出 随机 变量 X 和 YY 的 一 个 例子 ， 
数 不 是 (f * g)(z). 
考虑 一 颗 有 mn 面 的 均匀 骨 子 . 假设 每 次 抛 括 骨 子 都 是 独立 日 
后 , 所 得 到 数字 之 和 的 概率 密度 


到 其 精 散 , 但 是 现在 已 经 看 到 了 希望. 卷 积 是 理 


习 


使 


习题 10.8.3 


习题 10.8.4 了 


题 


解 这 些 和 式 的 起 


得 它们 的 概率 密度 函数 上 和 9 满足 : 和 十 


的 . 分 别 求 出 抛 撕 2 


上 旦 . 


一 个 非 负 整 数 ， 


如 果 一 个 随机 变量 可 以 写成 任意 多 个 独立 同 分 布 的 随机 变 
率 分 布 就 是 无 限 可 分 的 . 找到 一 个 无 限 可 分 的 随机 变量 的 多 
白松 分 布 是 一 种 常见 分 布 , 在 接 下 来 儿童 中 
其 概率 密度 就 是 P(X = n) 
设 随 机 变量 X 服从 参数 为 和 x 的 


明 : X 十 也 服从 参数 为 和 x 十 入 y 的 泊 松 分 布 . 


PP, 我 介 
Me /nl, 其 


白松 分 布 , 随机 变量 Y 服从 参数 为 和 y 的 


蛙 


之 和 , 那么 它 的 概 


I 子 . 

] 会 展开 详细 讨论 . 如 果 n 是 
Ph 入 > 0 是 一 个 给 定常 数 . 
白松 分 布 , 证 
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习题 10.8.5 
的 概率 密度 函数 都 是 


1 


Xe 
0 


其 中 , 和 为 参数 . 求 出 log(XY) 的 概率 密度 函数 . 


人 若 z>0 


其 他 ， 


一 


设 X 和 了 是 相互 独立 的 随机 变量 , 它们 服从 同一 个 指数 分 布 . 也 就 是 说 , 它们 


习题 10.8.6 ”如 果 X 和 YY 是 相互 独立 的 连续 型 随机 变量 ， 


且 它 们 的 概率 密度 函数 分 别 为 


fx 和 fy, 那么 XY 的 概率 密度 函数 就 是 [> fa(z)fy(z/7) dr. 对 于 两 个 相互 独立 


均 服从 (0, 1) 上 均匀 分 布 的 随机 变量 , 求 出 它们 乘积 的 概率 密度 函数 . 


| 人 
e-(?-/) /20 .证 


习题 10.8.7 ”参数 为 J 和 o 的 正 态 分 布 的 概率 密度 函数 是 f(z) = -局 
明 : 对 于 两 个 服从 正 态 分 布 的 随机 变量 , 它们 的 和 也 服从 正 态 分 布 
习题 10.8.8 ” 另 一 个 著名 的 分 布 是 对 数 正 态 分 布 . 顾名思义 , 如 果 和 服从 正 态 分 布 , 那么 


log X 就 服从 对 数 正 态 分 布 . 利用 上 一 题 的 结果 证 明 : 对 于 
变量 , 它们 的 乘积 也 服从 对 数 正 态 分 布 . 
习题 10.8.9 “” 当 交换 极限 与 积分 的 运算 次 序 时 , 我 们 必须 非常 小 心 . 设 
no—|z—nl Le 
fn(7) = 败 由 
| 0 其 他 . 


证 明 : lmn ee fv fn(z)dz #1 limn oo 万 (z 
习题 10.8.10 


dz. 


上 一 个 例子 说 明了 交换 极限 与 积分 的 运算 次 序 存在 一 定 的 风险 . 


两 个 服从 对 数 正 态 分 布 的 随机 


这 个 题 


说 明了 积分 次 序 并 不 总 是 可 以 交换 的 .为 了 简单 起 见 , 我 们 给 出 一 个 序列 amn, 它 满足 
,Damn) 关 , (amn). 这 是 个 不 错 的 练习 , 与 积分 非常 相似 . 当 m,n > 0 时 ， 
设 

1 若 n 二 mm 

am,n = $4 —1 若 n= 二 m+ 十 1 

0 其 他 . 
证 明 : 这 两 种 不 同 的 求 和 次 序 会 给 出 不 同 的 答案 (原因 是 , 这 些 项 的 绝对 值 之 和 是 发 散 
的 ). 

习题 10.8.11 ”我 们 通过 分 组 证 明了 卷 积 满足 结合 律 . 这 种 技巧 已 经 出 现 过 很 多 次 了 . 证 


如 果 两 个 函数 之 和 的 导数 前 


明 : 


的 情形 . 更 一 般 地 , 该 结论 适 
习题 10.8.12 ”我 们 看 到 , 对 随机 
子 独立 地 抛掷 8 次 后 , 所 得 至 


变量 
| 的 结果 可 以 按照 下 列 方式 分 组 : 


((Xi1+ KX2) + (Xs Xa)) + (Xs + Xe)1 


X74 Xs)). 


等 于 两 个 导数 之 和 , 那么 这 个 结果 可 以 马上 折 


E 广 到 三 个 函数 


] 于 任意 有 限 和 的 情况 , 但 无 限 和 的 导数 不 一 定 是 导数 的 和 . 
的 和 进行 分 组 可 以 简化 代数 运算 . 例如 , 把 一 颗 均 匀 


愉 


这 与 “重复 平方 法 ”非常 相似 , 它 在 许多 加 密 系统 (如 RSA) 


的 实际 应 用 


] (例子 请 参阅 


出 ee 


其 实 通 过 巧妙 地 分 组 , 只 需要 进行 10 次 以 下 的 乘法 运算 ! 


口 


发 挥 了 关键 作 


第 7 章 和 第 8 章 ). 我 们 可 能 会 天 真 地 认为 要 进行 99 次 乘法 运算 才能 求 


10.8 习 


题 
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习题 10.8.13 ” 根 


时 关系 式 g(h(y)) = y, 我 们 可 以 


jh 的 与 


数 来 表示 9 的 导数 . 这 是 种 强大 


的 方法 , 可 以 从 1 个 函数 的 导数 过 渡 到 另 一 个 函数 的 导数 . 例如 , 假设 已 知 ex 的 导数 是 
e”. 利用 这 一 点 证 明 : nz 的 导数 是 1/zx. 一 个 更 奇特 的 例子 (与 柯 西 分 布 有 关 ) 是 , 根据 
tan(z) 的 导数 是 1/ cos2(z), 求 出 arctan(z) 的 导数 . 

习题 10.8.14 ”我 们 详细 地 讨论 了 变量 替换 公式 中 的 映射 9 必须 是 一 对 一 的 映 上 函数 .证 
明 : g 有 唯一 的 逆 映 射 . 具体 地 说 , 设 g :了 一 J 是 一 对 一 的 , 并 且 是 映 上 的 . 证 明 : 它 存 
在 唯一 的 道 映射 h : J 一 I 另外 , 证明: 如 果 9 不 是 一 对 一 的 或 者 不 是 映 上 的 , 那么 上 
述 结论 不 成 立 . 


习题 10.8.15 
设 Y 二 VX. 求 出 Y 的 概率 密度 函数 . 

习题 10.8.16 ” 设 X 是 一 个 随机 变量 , 在 区 间 [一 
求 出 Y 的 PDF. 


设 X 是 一 个 随机 变量 , 表示 抛掷 一 


颗 ] 


1,1 


习题 10.8.17 ”想象 一 下 , 有 家 保险 公司 正在 试图 


个 人 提出 索赔 的 概率 都 是 p. 假设 保险 公司 有 100 个 保 六 


率 分 布 


的 匀 的 般 子 6 次 后 , 数字 1 出 现 的 次 数 . 


上 的 PDF 是 fx =1/2. 设 了 二 X2， 


森 右 
楚 


多 少 人 会 在 保 
E 持 有 人 , 利 


弄 ; 


习题 10.8.18 ”证 明 : 


绝对 收敛 的 . 


(f*g)=/f *g=9g *f,] 


其 中 上 撤 号 表示 微分 , 并 


iz 


习题 10.8.19 证明: 
PDF 时 , 所 有 积分 都 是 1.) (更 进 
习题 10.8.20 ” 写 一 段 可 以 从 一 个 随机 变量 


一 张 可 以 显示 YY 的 近似 PDF 的 柱 ; 
习题 10.8.21 设 X 是 一 个 PDF 为 fx 


大 图 . 


两 个 函数 的 卷 积 的 积分 是 这 
步 : 上 述 结 
中 取 很 多 样本 的 代码 , 这 个 
概率 密度 函数 是 fx(z) = 1. 设 X 是 一 个 PDF 为 fx 的 随机 变量 , 并 设 Y 


的 随机 变 


个 函数 的 积 
论 对 任意 


分 的 乘积 . ( 


-上 旦 . 


里 


PDF. 将 此 图 与 上 一 题 中 生成 的 柱状 图 
习题 10.8.22 ”对 于 两 
商 时 , 我 们 发 现 商 的 概率 密度 函数 是 fz(z) = 


进行 比 


习题 10.8.23 ” 设 随机 变量 2 服从 标准 正 态 分 布 ， 


个 相互 独立 且 都 服从 参数 为 和 的 指数 分 布 的 随机 变 和 
量 模拟 , 那么 模拟 的 均值 都 大 致 一 样 吗 ? 为 什么 ? 


设 2 和 V 是 相互 独立 的 . 令 了 = 2Z/VVIv. 求 出 人 的 概率 密度 


两 个 函数 都 


页 个 函数 都 成 立 吗 ? ) 
随机 变量 在 [0, 1] 上 


，Y 二 eX, 求 Y 的 分 布 . 绘 人 


SG > 1 


于 六 和 


县 


1/(1 十 2)?， 当 入 取 不 同 从 


随机 变量 V 服从 自 


的 怕 


为 的 (学 生 ) t 分 布 . 这 种 分 布 会 出 现在 很 多 统计 问题 中 , 尤其 是 如 


异 时 . 
习题 10.8.24 


gg 
[一 
这 


验 和 方差 分 析 . 另外 , 它 还 引出 了 下 检验 . 


度 为 di 的 卡 方 分 布 (参阅 第 16 章 ). 求 H 
的 概率 密度 函数 . 这 被 称 为 下 分 布 , 在 很 多 统计 问题 


FE 质 , 请 参阅 第 14 章 ; 关于 卡 方 分 布 的 性 质 , 请 参阅 第 16 章 . 我 们 说 月 
E 比 较 样本 均 


时 , 旭 


当 研 究 它们 下 
I 果 进 


关 守 


的 


XxX 作 咎 
二 eX 绘 抽 


的 


的 
行 了 


期 内 提出 索赔 . 每 
用 卷 积 求 出 这 个 概 


腿 设 所 有 积分 都 是 


县 
全 


| 


度 为 v 的 卡 方 分 布 ， 
F 正 态 分 布 


i 


民 从 


和 


中 发 挥 着 重要 的 作 / 


假设 我 
X 的 概率 密 
ZX 均 成 立 ， 


门 可 以 模拟 一 个 服从 均匀 分 布 的 随机 变 晶 
度 函 数 是 fx. 如 果 存 在 1 个 正 数 M > 1, 使 得 0< 广 
且 /fy(z)dzx = 1, 那么 我 们 就 可 以 模拟 出 1 个 概率 密度 函数 为 fy 的 随机 


时 U， 以 及 独立 于 它 的 随机 变 引 


时 


肥 


的 关 


B (Xi1/d1)/(X2/d2) 
, 例如 假设 检 


中 
z) < Mfx(zx) 对 所 有 的 
变 
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量 Y. 虽然 逆 CDF 法 可 以 让 我 们 轻松 地 从 柯 西 分 布 或 指数 分 布 这 样 的 分 布 中 生成 随机 变量 ， 


习 给 出 了 证 明 的 框架 . 


习题 10.8.25 。” 设 h(z) = fy(z)/Mfx(7z). 证 明 : 0 < h(x)<&<1， 


但 无 法 生成 服从 正 态 分 布 的 随机 变量 . 


央 此 , 这 种 方法 的 重要 性 应 该 是 显而易见 的 . 下 面 的 练 


Prob(U < X) = J 三 h(x)du: fx(x)dx = 立 / fy (zx)dzx. 
Z 一 一 co vu=0 一 co 


习题 10.8.26 ”如果 


这 个 条 件 得 到 满足 . 训 


Prob(Y < y) 


= Prob 


根据 两 个 服从 均匀 分 布 的 随机 3 
E 正 态 分 布 的 随机 变量 .用 其 中 一 个 均匀 分 布 来 确定 符号 , 并 


b 现 了 w < zx, 那么 设 Y = 六, 否则 就 不 对 Y 赋值 . 继续 进行 下 去 , 直到 
E 明 : Y 的 CDF 是 


(X<y HU<h(X))/Prob(U < h(r)). 


证 明 : 这 意味 着 Y 的 PDF 是 广 . 
习题 10.8.27 ”利用 上 述 方法 ， 
变量 来 模拟 出 一 个 服从 标 ; 


量 和 一 个 服从 指数 分 布 随机 


] 另 一 个 均匀 分 布 和 指数 分 布 来 模拟 半 正 态 分 布 . 注意 , 指数 分 布 很 容易 模拟 , 因为 它 有 
个 不 错 的 逆 CDF. 特别 是 , 要 找到 满足 2e-”/V37 < e-” 的 最 小 M，( 因 为 我 们 考察 的 


是 一 个 服从 正 态 分 布 的 随机 变量 的 绝对 值 , 所 以 这 里 要 把 标准 正 态 分 布 的 概率 密度 函数 


增加 1 倍 .) 


习题 10.8.28 ”在 上 面 的 方法 中 , 我 们 
这 样 的 M 一 定 存 在 吗 ? 如 
习题 10.8.29 求 出 M 的 期 户 


果 不 是 ， 


为 什么 想 让 M 的 值 尽 可 能 小 ? 对 于 给 定 的 (fx, fy), 
请 给 出 反例 ; 如 果 是 , 请 给 出 证 明 . 


值 , 并 


孚 释 它 所 代表 的 含义 . 


第 11 章 ”工具 : 微分 恒等式 
大 跳 对 身上 有 小 跳蚤 ， 
在 它们 背 上 叮咬 着 ， 
小 跳 寻 身上 有 更 小 的 跳蚤 ， 
就 这 样 无 限 循环 下 去 . 
一 一 “ 跳 妈 ”, 一 首 基于 乔纳森 ”斯 威夫 特 《 原 诗 : 狂想 曲 》 的 童谣 (1733) 


“给 我 们 工具 , 我 们 就 会 干 完 这 些 工作 .” 


温 斯 顿 丘吉尔 , 1941 年 2 月 的 广播 讲话 


本 章 是 介绍 工具 的 最 后 一 章 . 在 此 之 后 , 我 们 就 拥有 了 讨论 标准 分 布 所 需 的 全 
部 工具 , 接 下 来 将 展开 对 这 些 分 布 的 讨论 . 就 一 本 书 来 而 言 , 不 存在 唯一 “正确 ”的 
阅读 次 序 . 因为 本 书 的 主要 目的 是 对 经 典 的 概率 论 教 材 进行 补充 , 所 以 我 决定 把 各 
种 技巧 放 在 一 起 . 只 有 把 理论 一 次 又 一 次 地 应 用 于 不 同 的 特殊 分 布 之 后 , 这 些 理 论 
才能 真正 建立 起 来 . 

当然 , 这 种 方法 的 缺点 是 , 在 研究 理论 时 , 我 们 可 以 利用 的 例子 少 之 又 少 . 掷 便 
币 和 撕 山 子 的 例子 已 经 被 讨论 了 很 多 次 , 因为 可 以 很 快 地 将 其 表述 出 来 . 为 了 保持 
平衡 , 本 章 会 采用 不 同 的 方法 . 在 描述 了 一 般 理论 之 后 , 我 们 将 考察 几 个 与 最 重要 
的 标准 分 布 相关 的 例子 . 如 果 你 把 这 本 书 当 作 补 充 材料 , 那么 很 可 能 已 经 见 到 过 这 
些 分 布 了 . 如果 没有 见 过 , 可 以 快速 地 浏览 后 面 几 章 , 并 看 一 些 相关 的 材料 . 如 果 
不 愿意 这 么 做 , 也 不 必 担 心 . 本 章 不 会 涉及 任何 有 关 这 些 概率 分 布 的 内 容 . 最 重要 
的 是 , 这 些 并 不 是 繁重 的 练习 一 一 最 后 几 个 例子 是 故意 从 重要 的 随机 变量 中 挑选 出 
来 的 , 但 可 以 忽略 掉 , 只 将 其 视 为 有 趣 的 东西 即 可 . 

本 章 的 目的 是 解释 微分 恒等式 法 . 恒等式 是 数学 世界 里 的 必需 品 , 是 建立 各 种 
理论 的 基石 . 不 足 为 奇 的 是 , 要 证 明 一 个 恒等式 往往 需要 付出 很 多 努力 . 通常 , 我 们 
必须 做 一 些 巧妙 的 事情 . 学 生 一 般 可 以 逐 行 地 读 懂 证 明 , 但 要 学 会 如 何 实现 这 种 创 
造 性 的 飞跃 并 找到 论证 的 突破 口 , 还 需要 学 习 更 长 的 时 间 . 本 书 总 体 目标 之 一 ( 尤 
其 是 本 章 ) 就 是 帮助 你 实现 这 个 飞跃 . 

因为 恒等式 很 重要 , 而 且 通 常 很 难得 到 新 的 恒等式 , 所 以 任何 一 种 从 旧 恒 等 式 
中 推导 出 新 恒等式 的 方法 都 应 该 非常 受 欢 迎 ! 考虑 下 面 的 和 : 
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1 9: -3 -于 5 6 nn 
3+4181t161t31t61 += 和 
这 个 和 能 不 能 用 一 个 简单 的 表达 式 来 描述 ? 它 与 几何 级 数 非 常 相似 , 而 它 之 所 以 不 
是 几何 级 数 是 因为 : 分 式 的 分 子 是 n 而 不 是 1. 如 果 nn 不 存在 , 那么 它 将 是 一 个 比 


值 为 1/2 的 几何 级 数 . 


在 下 一 节 中 , 我 们 将 证 明 存在 


种 简 让 
这 将 涉及 微分 . 通过 对 某 个 几何 级 数 求 微分 , 我 们 可 以 


的 方法 由 1/2” 的 和 来 得 到 ny2” 的 和 . 
得 到 一 个 求 和 公式 . 这 是 种 


地 描述 这 种 方法 , 但 现在 先 简单 地 说 一 下 这 种 方法 为 什么 好 . 


此 , 任何 一 种 利 


用 已 知 恒等式 来 


9 用 的 , 能 够 创造 无 穷 多 个 新 恒等式 的 方法 特别 受 欢迎 ! 
下 等 式 两 端 相 等 , 那么 对 该 参数 求 微 


相 


解决 问题 的 一 般 方法 , 即 微分 恒等式 法 
我 们 稍 后 会 详 引 

正如 上 面 所 说 的 , 生成 一 个 新 恒等式 通常 很 难 . 因 

创建 新 恒等式 的 方法 都 是 有 

微分 运算 并 不 难 , 如 果 能 证 明 一 个 带 有 参数 的 

分 就 能 产生 一 个 新 的 恒等式 ! 与 大 部 分 数学 方法 

万 

的 小 技巧 . 

11.1 几何 级 数 的 例子 

正式 给 出 微分 恒 等 法 之 前 , 我 们 先 来 看 一 个 例子 . 二 


方法 应 该 是 什么 . 我 们 会 考察 两 个 不 同 版 本 的 例子 . 这 种 做 法 能 


lL, 最 难 的 部 分 通常 是 代数 运算 ， 
比 是 寻找 一 种 能 够 简化 最 终 表 达 式 的 好 方法 .我们 会 讨论 一 些 让 公式 更 加 整洁 


E 学 习 的 过 程 中 会 看 到 一 般 
让 我 们 看 到 , 当 整 


理 公式 中 的 代数 运算 时 可 能 会 出 现 哪些 问题 
假设 基于 某 种 原因 (可 能 是 因为 表达 式 过 于 简单 ), 我 们 要 计算 
1 2 3 4 5 6 7 nn 
Te A 2 2n-1 Uy 
要 做 的 第 一 件 事 就 是 确保 级 数 收敛 ,这 一 点 可 以 利用 微 积 分 中 的 比较 判别 法 来 完 
成 . 对 于 较 大 的 mw 比较 器 和 可. 图 11-1 中 绘制 了 前 几 个 部 分 和 , 表明 极限 值 
是 4. 现在 来 证 明 一 下 . 
我 们 没有 说 太 多 关于 微分 恒等式 法 的 内 容 . 目前 提 到 的 所 有 内 容 只 是 在 恒等式 


的 两 端 要 有 同 
级 数 有 关 . 我 们 首先 想到 的 


个 自 


是 


1 


和 


虽 
上 弓 


任何 变量 ! 现在 只 有 两 个 相等 的 表达 式 


el 
和 
n=0 


然 这 种 想法 是 正确 的 , 但 此 时 微分 提供 不 了 任何 有 用 的 东西 , 因 


参数 , 然后 对 该 参数 进行 微分 . 注意 , 这 个 级 数 好 像 与 几何 


1—1/2 | 


为 我 们 没有 看 到 
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5 10 15 20 
图 11-1 级 数 > 1n/2”1! 的 前 20 个 部 分 和 . 注意 , 这 个 极限 看 起 来 是 4 


我 们 试 着 把 问题 抽象 化 . 不 要 孤立 地 考虑 这 一 个 问题 , 而 是 将 其 推广 并 归结 为 
众多 问题 中 的 一 个 , 而 所 有 这 些 问 题 都 有 相似 的 形式 . 在 数学 上 , 考察 一 般 情况 通 
常 比 解决 具体 例子 更 容易 . 这 看 起 来 可 能 有 点 奇怪 , 所 以 我 们 先 说 明 一 下 为 什么 这 
样 做 . 

。 首先 , 如 果 只 考虑 一 个 特定 的 实例 , 那么 可 能 会 被 实际 的 数字 误导 . 换 句 话 

说 , 就 这 个 问题 而 言 , 我 们 可 能 会 认为 2 在 解 题 中 非常 重要 , 因为 2 在 任何 

地 方 都 会 出 现 . 

。 其 次 , 把 问题 推广 后 , 我 们 就 可 以 使 用 更 强大 的 技巧 . 稍 后 会 详细 地 阐述 这 
一 点 , 其 基本 思想 如 下 . 我 们 不 考察 某 个 具体 的 和 , 而 是 研究 一 系列 和 . 现在 

有 一 个 参数 可 供 使 用 , 而 且 我 们 还 可 以 利用 连续 性 和 微分 的 相关 结果 ( 即 微 
积分 ) 来 获取 信息 . 
所 以 , 我 们 不 研究 式 (11.1) 的 和 , 而 是 考察 更 一 般 的 情形 


六 > 和 (11.2) 
n= 


同样 地 , 由 比较 判别 法 可 知 , 当 |z| < 1 时 该 级 数 收敛 . 如 果 式 (11.2) 的 乘积 之 前 没 
有 n, 那么 这 个 级 数 就 很 容易 计算 了 : 根据 几何 级 数 公 式 (参见 1.2 市 ), 有 


> 1 
jz"= . (11.3) 
= 1—Zz 


现在 就 开始 看 到 抽象 的 力量 了 . 在 得 到 关于 1/2" 和 式 的 恒等式 之 前 , 我 们 有 了 一 

关于 z” 和 式 的 恒等式 . 关键 是 , 这 个 恒等式 适用 于 满足 lz| < 1 的 所 有 z. 可 供 
选择 的 z 构成 了 一 个 连续 区 间 . 当 x 改变 时 , 等 式 仍然 成 立 . 这 就 开启 了 在 等 式 两 
端 对 z 求 微分 的 可 能 性 . 为 什么 要 这 样 做 ? z" 的 导数 就 是 nz"-!. 如 果 令 z = 1/2. 
就 可 以 求 出 式 (11.1) 的 和 . 


大 入 
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事实 上 , 我 们 要 做 的 不 仅仅 是 对 上 述 等 式 的 两 端 求 微分 , 还 要 交换 求 和 与 求 微 
分 的 次 序 . 对 1/(1 一 z) 求 导 没有 问题 , 但 是 为 了 保证 等 号 左 端的 求 导 与 求 和 可 以 交 
换 次 序 , 我 们 需要 利用 分 析 学 中 的 一 些 结果 . 这 样 做 的 原因 是 , 在 微 积分 中 ,“ 和 的 
导数 就 是 导数 的 和 ”只 适用 于 有 限 和 ; 对 于 无 限 和 的 情形 , 我 们 必须 要 齐 慎 . 在 入 
门 课 上 , 这 一 点 经 常 被 一 带 而 过 , 甚至 完全 忽略 . 不 考虑 技术 细节 是 很 好 的 , 但 你 应 
该 有 意识 地 保持 严谨 . 在 B.2.2 节 中 , 我 们 会 提供 一 些 这 方面 的 内 容 . 
因此 , 在 确定 可 以 交换 求 导 与 求 和 的 次 序 后 , 我 们 得 到 了 


dd dl1 
本 ~ dsl-z 
dv 1 
dr (1 2)? 
生 1 

7 一 _ 
和 ”TT 


现在 , 只 要 把 > = 1/2 代入 上 面 的 结果 就 可 以 解决 原来 的 问题 . 就 这 个 问题 而 言 , 只 
要 |z| < 1, 就 可 以 证 明 求 和 与 求 微分 的 运算 次 序 可 以 互 换 . 令 x = 1/2, 我 们 看 到 这 
个 结果 就 是 4 与 之 前 声明 的 一 样 . 

现在 对 这 个 问题 做 些小 变动 . 假设 我 们 想 求 出 


We | FF 一 十 …: 十 = 上 
2 4 8 16 32 64 加 人 2 


Wi 


这 个 问题 有 两 种 解法 . 首先 注意 到 的 是 , 这 是 上 一 个 问题 中 和 的 1/2, 所 以 只 需要 
把 上 面 的 答案 乘 以 1/2 (这 告诉 我 们 答案 就 是 2). 另 一 种 方法 是 , 把 运算 符 * 东 应 
用 于 几何 级 数 公 式 的 两 端 , 而 不 是 二 . 这 样 做 的 好 处 是 , 在 求 微分 时 , xz 的 蜘 保持 
不 变 . 当 求 一 阶 导 时 , 这 并 不 重要 , 但 在 概率 论 的 很 多 应 用 中 要 进行 多 次 微分 , 这 将 
会 有 很 大 的 不 同 . 

在 这 个 问题 中 , 把 > 功 应 用 于 式 (11.3) 两 端 , 可 得 


2 Hw) 


如 果 令 x = 1/2, 那么 和 就 是 2. 
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这 个 和 能 用 一 个 不 错 的 公式 来 表示 吗 ? 我 们 从 几何 级 数 公 式 开 始 : 
OO > 1 
到 ee 
n=0 
把 z 马 应 用 于 上 式 两 端 , 这 里 的 因子 xz 是 为 了 防止 x 的 容 被 降低 . 于 是 
ee z 
现在 , 再 次 利用 x 起, (在 应 用 商 的 求 导 法 则 并 做 了 一 些 代 数 运算 之 后 ) 可 得 
如 果 令 x = 1/2, 就 得 到 了 想 要 的 和 , 它 等 于 6. 
这 个 例子 很 好 地 阐释 了 这 种 方法 . 只 需要 多 一 点 工作 , 我 们 就 可 以 用 n? 来 代 
蔡 n, 进而 得 到 另 一 个 新 的 恒等式 . 现在 , 本 章 开 头 章 谣 的 意思 应 该 很 清楚 了 . 


11.2 ”微分 恒等式 法 
在 几何 级 数 例子 的 启发 下 , 我 们 给 出 一 个 有 用 的 微分 恒等式 法 . 虽然 它 不 是 最 


通用 的 方法 , 但 适用 于 很 多 性 


况 . 


Nmax 


N=Nmin 


可 以 交换 , 那么 


Nmax 


> 


微分 恒等式 法 : 设 o 6,y,… 
2 


中 了 和 g 是 关于 a 的 可 微 函数 . 如 果 f 退化 到 足以 保证 求 和 与 求 微分 的 次 序 


0f(n;a, B,.. ,WwW) 


,w 是 一 些 参数 . 设 


Nn; 0 四， ,WW) 二 9(a, 0 ,ww)， 


Og(a, 9 ;0) 


N=Nmin 


Oa Oa 


最 简单 的 情况 是 , 上 面 的 main 和 nmax 是 有 限 的 , 因为 这 样 就 可 以 交换 运算 次 


序 了 . 注意 , 这 种 方法 及 应 


AAA 


目 展 现 了 两 个 强大 的 分 析 学 结果 . 正如 刚才 提 到 的 , 第 


一 个 是 交换 求 和 (可 以 是 无 限 和 ) 与 求 导 的 运算 次 序 . 在 数学 和 物理 中 , 交换 求 和 次 


序 或 者 交换 求 和 与 求 导 的 次 


字 是 常用 的 技巧 . 第 二 点 要 注意 , 我 们 并 不 是 具 考虑 一 
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个 恒等式 , 而 是 考虑 包含 某 参数 的 一 系列 恒等式 . 有 一 个 连续 的 取 值 范围 是 很 重要 
的 , 否则 无 法 使 用 微 积分 . 

在 接 下 来 的 几 节 中 , 我 们 将 应 用 这 种 方法 来 计算 一 些 标准 随机 变量 的 矩 . 如 果 
你 之 前 没有 见 过 这 些 随 机 变量 , 可 以 查看 相关 章节 了 解 更 多 , 但 是 没 必 要 和 弄 清楚 到 
底 发 生 了 什么 . 接 下 来 的 任务 是 , 展现 微分 恒等式 法 如 何 通过 代数 运算 给 出 更 好 的 
解 题 思路 , 而 不 是 用 蛋 力 来 找 出 矩 . 


11.3 ”在 二 项 分 布 随 机 变量 上 的 应 用 


考虑 进行 了 n 次 试验 的 二 项 分 布 , 每 次 试验 成 功 的 概率 均 为 p (编码 为 1)， 
次 失败 的 概率 均 为 1 一 p (编码 为 0). 这 与 抛掷 一 枚 便 币 n 次 , 并 且 每 次 出 现 正面 
的 概率 是 p, 出 现 反面 的 概率 是 1 - 2 的 情况 一 样 . 如 果 和 表示 出 现 正 面 的 次 数 ， 
那么 


(Pp (1 — p)™—* 若 kk€ {0,1,.… ,7n} 

0 其 他 . 

个 服从 二 项 分 布 的 随机 变量 , 我 们 会 在 12.2 节 展 开 讨 论 . 为 了 说 明 它 是 随机 变 
量 , 必须 证 明 概率 是 非 负 的 , 并 且 和 为 1 非 负 性 很 容易 证 明 , 但 和 为 1 要 利用 二 项 
式 定理 得 出 (参见 A.2.3 节 ), 即 


Nn nN {et 
(z+y)” = (om 人 
k=1 


Prob(X = Ek) = | 


[ee 
Pt 


令 z=p 且 y= 1 一 p, 这 样 就 证 明了 概率 之 和 为 1. 

既然 已 经 证 明了 这 是 一 个 概率 分 布 , 要 问 的 第 一 个 问题 就 是 它 的 均值 是 多 少 
(下 一 个 问题 是 方差 是 多 少 )， 我 们 已 经 看 到 过 通过 直接 计算 来 回答 这 些 问 题 的 方 
法 , 现在 来 看 一 下 如 何 利 用 微分 恒等式 来 得 出 相同 的 答案 . 

与 上 面 的 几何 级 数 公式 相似 , 我 们 需要 一 个 可 以 微分 的 自由 参数 . 在 该 问题 中 ， 
这 个 参数 就 是 p, 即 每 次 掷 出 正面 的 概率 . 虽然 问题 给 出 了 p 的 一 个 特定 值 , 但 推 
导出 对 任意 p 均 成 立 的 公式 会 更 容易 , 最 后 让 p 等 于 这 个 给 定 值 即 可 . 这 种 方法 允 
许 我 们 使 用 微 积分 工具 . 
因此 , 要 想 研 究 服从 二 项 分 布 的 随机 变量 , 就 应 该 考虑 


(p+q)” = 3 (re (11.4) 


k=0 


如 果 让 pe [0,1 并 且 g = 1 一 p, 就 得 到 了 一 个 二 项 分 布 , 并 且 (p 十 q)”= 1. 现在 
求 上 式 对 p 的 微分 . 虽然 最 终 会 确定 g = 1 一 p, 但 现在 把 p 和 4 看 作 相 互 独立 的 
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变量 . 原因 是 , 如 果 令 g = 1 一 p, 那么 gq 关于 7 的 导数 就 不 为 0. 事实 上 , 如 果 取 
4=1-2 那么 上 面 的 和 就 是 1, 因此 它 的 导数 就 是 0. 现在 , 我 们 看 到 了 最 初 令 p 
和 9 无 关 的 重要 性 . 


I 


计算 均值 : 现在 来 计算 均值 , 它 等 于 
= DR (pp 
k=0 


微分 恒等式 法 不 仅 可 以 从 二 项 式 公 式 中 给 出 这 个 表达 式 , 还 告诉 我 们 这 个 式 子 等 于 
什么 ! 


[ 


事实 上 , 虽然 可 以 通过 对 p 求 微分 来 得 出 均值 (也 就 是 说 , 将 式 (11.4) 的 两 端 
同时 乘 上 3/9), 但 如 果 改 用 运算 符 p 各 ,那么 最 终 的 代数 运算 会 更 容易 些 . 这 样 
做 的 好 处 是 , p 和 g 在 表达 式 中 的 宕 不 会 改变 . 于 是 


因为 这 是 一 个 有 限 和 , 所 以 交换 微分 与 求 和 的 运算 次 序 是 合理 的 . 现在 令 gq = 1 一 p， 
那么 预期 的 成 功 次 数 (每 次 试验 成 功 概率 均 为 p) 为 


Dx (sap = np. (11.5) 


注意 , 直到 最 后 , 我 们 才 让 g = 1 一 2， 如 果 在 早 些 时 候 就 替换 , 那么 最 终 会 得 到 
0= 0, 这 是 没有 用 的 ! 由 于 上 述 等 式 的 左 端 就 是 均值 的 定义 , 这 个 均值 就 是 np. 答 
案 与 我 们 的 直觉 相符 , 非常 好 : 人 枚 硬币 n 次, 并 且 每 次 括 出 正面 的 概 
率 均 是 p, 那么 预计 会 得 到 np 个 正面 . 
机 2 i 现在 可 以 进行 选择 : 可 以 再 次 应 用 
算 子 7 总 ,也 可 以 把 p? 9 运用 到 二 项 式 定 理 中 , 即 式 (11.4). 虽然 两 者 都 能 给 出 


正确 的 方差， 但 是 如 果 使 用 7 六 两 次 , 那么 代数 运算 会 更 容易 些 . 


记 住 X ~ Bin(n,p) (这 个 符号 表示 随机 变量 X 服从 参数 为 n 和 p 的 二 项 分 
布 ). 这 里 有 两 个 方差 公式 : 
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VaCO = BX p00 = Dm) (人 ma- 由 


Var(X) = EIXJ— EIX] = Ye. (rap = 


我 们 马上 会 看 到 , 使 用 第 二 个 公式 要 比 使 用 第 一 个 公式 更 容易 . 
从 下 面 这 个 等 式 开始 


根据 均值 的 相关 性 质 , 我 们 知道 使 用 7 六 一 次 就 会 得 到 


再 次 使 用 "六 可 得 


2 的 = 20:np+oO +p. nn lp+q" "|. 
k=0 


如 果 令 g=1 一 p, 那么 上 式 就 变 成 了 
并 (za 一 DAT 一 ID 


另外 , 注意 等 式 的 左 端 就 是 E[X3]. 于 是 


a >》， 有 2 的 (np)? 
一 mp 十 mn2p2 np — np? 
=72 一 02” = np(l—p). 
我 们 的 目的 是 学 习 如 何 使 用 微分 恒等式 法 , 所 以 必须 意识 到 寻找 这 种 使 代数 运 
算 更 容易 处 理 的 方法 有 多 重要 . 不 考虑 使 用 pi 丙 次 , 我 们 来 看 看 把 运算 符 严 束 
应 用 到 式 (11.4) 会 发 生 什 么 . 这 个 运算 符 更 适用 于 微分 , 正如 我 们 将 看 到 的 , 它 会 
使 代数 运算 更 加 混乱 . 我 们 有 
8? n 光 92 
DB 3 Qe) = DB (p+q)”. 


k=0 
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进行 简单 的 代数 运算 后 , 可 得 


iD 人 (Je = pnn— p+ . (11.6) 
k=0 
不 幸 的 是 , 我 们 要 找 的 方差 是 


Nn 


Sep)? () peg 


k=0 


其 中 j= np 是 服从 二 项 分 布 的 随机 变量 X 的 均值 . 这 个 方差 也 可 以 写成 
a jos k mm 一 大 _ (np)?. 


利用 式 (11.6) 得 到 方差 并 不 是 个 大 问题 . 我 们 可 以 利用 E[X?] - E[X]? 来 求 方差 ， 
并 且 K(k 一 1) 可 以 写成 大 一 大 注意 , 大 的 和 是 E[X3], 而 的 和 是 均值 . 因此 


n(n — Dp (p+ og)" (ee (we 


我 们 已 经 知道 第 二 个 和 是 多 少 一 一 当 g = 1 一 p 时, 第 二 个 和 就 是 np. 令 gq=1--p， 
我 们 有 


Tn 
Di) = n(n— Dr +np = np +np(l—p). (11.7) 
vet 


因此 , 方差 不是 


J ) -人 jz ss (Tr) | 


=np +np(l —p)— (np)? 


这 与 之 前 的 结果 是 一 样 的 
最 后 , 重新 看 看 式 (11.5) 和 式 (11.7). 如 果 令 p= 4 = 1/2, 并 把 因子 都 移 到 等 
式 的 右 端 , 就 得 到 了 


2 = 27, 2 J = n(n+1)2"2. 


因此 , 我 们 可 以 找到 关于 二 项 式 系数 及 其 指标 的 乘积 之 和 的 表达 式 . 值得 注意 的 是 ， 
即便 只 想 求 出 整数 和 或 有 理 数 和 , 我 们 也 必须 有 连续 的 变量 , 这 样 才能 使 用 微 积 4 
工具 . 
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11.4 ”在 正 态 分 布 随 机 变量 上 的 应 用 


XX ~ N(1,0?) 表示 X 服从 均值 为 1 且 方 差 为 o? 的 正 态 分布 , 那么 它 的 概率 
密度 函数 是 


1 
fx(7x) = Vo 
我 们 将 在 第 14 章 中 详细 地 讨论 如 何 计算 这 个 积分 , 从 而 证 明 这 就 是 一 个 概率 分 布 . 
在 证 明了 它 是 一 个 概率 分 布 之 后 , 接 下 来 的 问题 就 是 它 的 均值 是 多 少 , 方差 是 多 少 ， 
以 及 矩 是 多 少 . 
我 们 把 注意 力 集中 在 标准 正 态 分 布 上 , 它 的 概率 密度 函数 为 


e—(e—1)?/207. 


(27) -1/? exp( 一 z2/2). 


那么 , 计算 就 简化 成 了 


1 
MI(k) 一 上 2 V 绝 e-® /2dz. 


当 友 取 奇 数 时 , 积分 显然 为 0, 因为 此 时 求 的 是 一 个 奇 函 数 在 对 称 区 间 上 的 积分 . 
(注意 , 正 态 分 布 的 衰退 速度 非常 快 , 从 而 使 得 所 有 积分 都 存在 .)k 取 偶 数 时 的 处 理 
方法 至 少 有 两 种 : 绰 力 积分 和 使 用 微分 恒等式 . 

标准 方法 : 首先 采用 杰 力 积分 法 , 它 是 通过 归纳 法 和 分 部 积分 法 来 实现 的 . 考 
虑 方 靶 . 因为 均值 是 0, 所 以 方差 就 是 


1 2 
12.—— e-® /2dzx. 
We V2T 


要 想 使 用 分 部 积分 法 , 必须 确定 w 和 dv 的 值 . 我 们 刚 开始 可 能 会 认为 , 要 么 选择 
u = 2Z2、 要 么 选择 dv = z2dz, 但 如 果 尝 试 其 中 任何 一 种 做 法 , 我 们 都 会 遇 到 麻烦 . 
原因 在 于 , 找 不 到 e-*/2 的 一 个 合适 的 原 函 数 . 幸运 的 是 还 有 希望 . 函数 e-” /2 可 
以 与 因子 x 组 合 在 一 起 , 因为 e-” /2z 会 有 个 不 错 的 原 导数 . 因此 , 我 们 试 着 令 


DH 


4 一 Z， dv = ——e 


这 样 就 得 到 了 du = dz 和 w= (2n)-1/2e-**/2. 于 是 有 


2 Se 1 2 
十 一 -ee /2dz = I(0) = 1. 
一 Do es V2 (0) 


现在 , 我 们 已 经 证 明了 二 阶 和 矩 是 1! 
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更 一 般 地 , 假设 我 们 有 M(2k) = (25 一 TU 这 里 的 双 阶 乘 表 示 只 考虑 阶乘 里 的 
奇数 项 . 接 下 来 按照 上 面 的 步骤 进行 . 为 了 求 出 M(2k + 2), 在 使 用 分 部 积分 法 时 ， 
我 们 会 令 = z28+1 那么 du = (2 十 1)zzkdz. 当 计 算 十 ce 处 的 值 时 , 边界 项 就 消 
失 了 , 于 是 有 


M(2k+2) = (2k + 1/ 0 ez /2dz 
88 T 


= (2k+1)M(2K) = (2k+1)2k-D! = (2 十 TU 


微分 恒等式 法 : 接 下 来 说 明 如 何 利 用 微分 恒等式 计算 矩 . 在 这 里 讨论 微分 恒 等 
式 似 乎 有 些 奇怪 , 因为 


2 1 
MI(2k) = Le-® /2dz 
es 27 


没有 自由 参数 ! 要 记 住 抽象 化 : 我 们 不 研究 这 个 具体 的 概率 密度 函数 , 而 是 考察 具 
有 自由 参数 的 一 系列 概率 密度 函数 
从 下 面 这 个 事实 开始 


1 一 1 L ez /20° dx; 
_o0 V2Ta2 


这 表明 了 上 面 是 均值 为 0 旦 方差 为 o? 的 正 态 分 布 的 概率 密度 函数 . 把 o 挪 到 等 
号 的 另 一 端 可 得 本 
0 一 i SE ez /20° dx. 
我 们 把 ?号 用 于 上 式 两 端 . 这 里 为 什么 要 乘 上 o3? 原因 在 于 , 微分 会 对 -x2o-?/2 
产生 影响 , 从 而 引入 一 个 因子 zzo-3. 因此 , 如 果 我 们 乘 上 o3, 那么 整个 式 子 就 会 
保持 好 的 形式 (也 就 是 说 , 在 等 式 的 右 端 , c 的 窜 没 有 改变 ). 计算 一 次 微分 后 , 就 得 
到 了 ee 
Oh QQ 1 ?2/20? 
"= 有 20 dz. 


交换 求 导 与 求 积分 的 次 序 后 , 我 们 注意 到 是 er-* /2 ”就 是 er-” /2””.z2, 于 是 有 


人 


这 样 就 证 明了 


328 第 11 章 工具 : 微分 恒等式 


此 外 , 积分 IT(k;o) 与 标准 正 态 分 布 的 第 M(k) 之 间 存 在 一 种 简单 的 关系 : 
I(k;1) = M(k). 


更 一 般 地 说 , I(k;o) 是 均值 为 0 日 方差 为 o? 的 正 态 分 布 的 天 阶 矩 . 除 以 o = Vo3 
的 原因 是 , 这 个 积分 里 只 有 因子 1/V2n, 而 没有 1/V2rc2. 


我 们 证 明了 
1:03 = 1(2;o) 和 I(k;1) = M(k). 
稍 后 会 看 到 写 1. 05, 而 不 是 只 写 o3 是 很 方便 的 . 把 ?是 应 用 于 上 式 两 端 可 得 
Wd re 
0 .3.1c” = 大 人 dz = 7T(4;o)， 
等 价 于 


3.1.o5 = 1(4;0). 
将 忠告 再 次 用 于 上 式 两 端 , 我 们 有 
03.5.3.104=5...3...1...07 = 1(6;0); 


注意 , 式 子 左 端 是 51.….o7. 我 们 现在 只 是 进行 简短 的 归纳 , 而 不 是 证 明 关 于 偶数 
矩 的 公式 . 如 果 有 


(2k — 1)!. ot! = I(2k;o), 
再 使 用 一 次 os 上 就 得 到 了 


0o3.(2k+1).(2k— .0 = TO 十 2;c). 


令 o=1, 则 有 


(25+IHDU = TQ2k+2,1) = M(2k+2), 
这 样 就 证 明了 关于 和 矩 的 公式 . 

注意 , 就 这 个 问题 而 言 , 虽然 微分 恒等式 非常 有 用 , 但 我 们 并 不 能 立即 看 出 需 
要 使 用 哪个 恒等式 ! 缩小 选择 范围 的 一 种 方法 是 , 要 意识 4 考虑 那些 我 们 关 
心 的 概率 密度 函数 , 否则 无 法 求 导 ! 如 果 使 用 二 而 不 是 好, 那 就 会 有 更 多 的 代 
数 运 算 需 要 处 理 , 因为 我 们 要 利用 乘积 法 则 来 求 导 . 这 再 次 说 明了 处 理 数学 问题 中 
的 代数 运算 有 多 么 困难 , 我 们 想 通 过 巧妙 地 选择 微分 运算 符 来 减少 代数 运算 量 . 


11.5 ”在 指数 分 布 随机 变量 上 的 应 用 


微分 恒等式 法 可 以 应 用 到 几乎 所 有 的 分 布 中 , 用 来 计算 均值 、 方差 , 或 者 任何 
和 矩 . 它 有 哪些 限制 呢 ? 我 们 要 把 目标 分 布 放 在 一 系列 概率 密度 函数 中 来 考察 , 而 这 些 
概率 密度 函数 与 若干 个 参数 有 关 , 并 且 至 少 有 一 个 参数 是 可 微 的 . 我 们 来 解读 这 人 名 


11.5 在 指数 分 布 随 机 变量 上 的 应 用 329 


话 . 假设 概率 密度 函数 存在 有 限 的 均值 和 方差 . 然后 , 我 们 把 它 写成 f(x; 091,… ,01)， 
这 里 的 6，…… ,091 都 是 参数 . 那么 大 阶 窍 就 可 以 写成 


/ zf (x;01,..- ,01) dx. 


1= 人 Go dz, 


我 们 的 目标 是 使 用 微分 运算 符 , 并 最 终 得 到 阶 窃 的 公式 . 我 们 将 通过 男 一 个 例子 
来 说 明 这 一 点 . 
考虑 一 个 服从 指数 分 布 的 随机 变量 . 如 果 XX ~ Exp( 和 ), 那么 X 的 概率 密度 函 


数 是 
和 -le-z 人 /入 若 z>0 
£4 | 0 其 他 ; 
注意 , 有 些 书 会 用 不 同 的 方式 来 定义 指数 分 布 的 概率 密度 函数 , 让 1/ 和 扮演 和 的 角 
色 . ( 题 外 话 : 我 更 喜欢 第 一 种 方式 , 因为 它 会 给 出 一 个 均值 为 入 的 指数 型 随机 变 
量 . 另 一 种 看 待 它 的 方法 是 , 第 一 种 方法 的 x 和 入 具有 相同 的 单位 . 我 们 不 能 对 
一 个 有 单位 的 量 取 有 震 ， i ZX/ 入 是 无 单位 的 . 替换 后 的 符号 是 和 Ax, 此 时 z 和 
入 具有 不 同 的 “单位 ”.) 
我 们 从 概率 密度 函数 的 积分 值 为 1 这 个 事实 开始 : 


Bs A 
0 入 


即使 只 关心 标准 的 指数 分 布 ( 即 入 = 1), 仍然 需要 一 个 自由 参数 和 一 系列 函数 ， 
为 如 果 不 这 样 做 , 就 不 能 求 微分 ! 为 了 更 好 地 进行 运算 , 等 式 两 端 要 同时 乘 以 入, 于 


是 有 


从 下 面 的 式 子 开始 


男 


荆 


入 = ez/>dz. (11.8) 
0 


如 果 把 d/dx 用 于 式 子 两 端 , 会 看 到 等 式 右 端的 指数 ~z/》 贡献 了 一 个 z/X?, 这 表 
明了 》2 生 是 更 好 的 运算 符 . 当 把 它 应 用 于 式 (11.8) 两 端 时 , 会 得 到 


》2 .1 = | a = ze-z/Adz. 
0 0 


如 果 想 求 出 标准 指数 分 布 的 均值 , 只 要 令 入 = 1 就 行 了 . 参数 为 和 的 指数 分 布 
的 均值 是 多 少 呢 ? 此 时 , 我 们 看 到 等 式 右 端的 积分 并 不 是 我 们 想 要 的 . 均值 是 


> 1 
LT. ~ e-*/Ndz, 
0 入 
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| Xe Tt/Ndz. 
0 


当然 , 解决 办 法 就 是 把 上 式 两 端 同 时 除 以 和 进而 得 到 


入 二 [Ee 
0 入 


方差 等 于 多 少 呢 ? 因为 均值 不 是 0 (而 是 入), 所 以 这 里 的 计算 会 比 标准 正 态 分 
布 时 的 计算 更 难 一 些 . 我 们 要 利用 Var = E[X?] 一 EE[X3]. 把 入 应 用 于 式 (11.8) 


两 端 可 得 _ 
》2 = 下 re—*/Ndz. 
0 


AX2.2A 一 re /Ndz. 
0 


但 现在 有 


再 次 应 用 和 县 可 得 


把 上 式 两 端 同 时 除 以 和 则 有 


2 入 = 上 re 和 = EIX?]; 


因此 E[X?] = 2X2. 因为 均值 是 E[X] = 入, 所 以 
Var(X) = EL[X?] — EIX]? = 2X-—-X = NX, 

这 就 是 指数 分 布 的 方差 . 当然 , 我 们 也 可 以 直接 通过 分 部 积分 法 得 到 方差 , 这 取决 
于 你 喜欢 哪 种 方法 . 

作为 一 个 不 错 的 练习 , 继续 用 这 种 方法 来 计算 三 阶 矩 和 四 阶 矩 . 计算 三 阶 矩 最 
简单 的 方法 是 利用 式 子 
(X11)] = EX 3X.+3X — 1] 
= E[X®] 一 3E[X®]p + 3E[X] — py, 


对 于 参数 为 和 的 指数 分 布 , 其 均值 六 = E[X] 就 是 和 我 们 已 经 求 出 了 EIX?3] 的 值 ， 
要 想 求 出 三 阶 矩 , 现在 只 需要 算出 E[X3] 就 行 了 . 


本 章 开头 引用 了 一 段 有 趣 的 童谣 , 其 灵感 来 源 于 乔纳森 ”斯 威夫 特 的 一 首 诗 ， 
它 优美 地 描述 了 微分 恒等式 的 范围 ; 
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大 跳 对 身上 有 小 跳蚤 ， 

在 它们 背 上 叮咬 着 ， 

小 跳蚤 身上 有 更 小 的 跳蚤 ， 

就 这 样 , 无 限 循环 下 去 . 
这 是 个 永 无 止境 的 过 程 . 就 像 小 跳 荔 身上 有 更 小 的 跳蚤 那样 , 只 要 得 到 了 一 个 恒 等 
式 , 我 们 就 可 以 不 断 地 构造 出 越 来 越 多 的 恒等式 . 做 到 这 一 点 非常 重要 . 我 们 在 第 
9 间 中 讲 过 概率 分 布 的 条 就 像 是 函数 的 泰勒 系数 , 由 这 些 转化 可 以 推出 概率 密度 函 
数 . 由 于 这 个 过 程 永远 不 会 结束 , 我 们 能 够 得 到 所 有 和 矩 的 公式 . 利用 几何 级 数 公式 
和 二 项 式 定理 等 已 知 的 内 容 , 我 们 可 以 学 到 大 量 新 知识 , 这 真 的 非常 惊人 . 


11.7 习 题 


习题 11.7.1 ”正弦 函数 的 二 倍 角 公式 是 sin(2z) = 2sin(z) cos(z). 利用 这 一 点 求 出 余弦 函数 
的 二 倍 角 公式 . 

习题 11.7.2 ” 找 出 并 解释 下 列表 述 中 的 错误 : 给 定 方程 az 十 bx 十 c 二 0, 式 子 两 端 同时 对 z 
求 两 次 微分 , 从 而 得 到 2a = 0, 因此 a = 0. 剩 下 的 项 bx 十 c= 0 对 z 求 一 次 微分 , 则 有 
b = 0. 因此 , 对 于 所 有 的 z, c 也 等 于 0. 


习题 11.7.3 ”证 明 : 对 于 任意 一 个 多 项 式 ao + alz + aaz2 十 … 十 anz” 如 果 该 式 恒 等 
那么 ao = al = a2 .二 an = 0. 
习题 11.7.4 ”在 本 章 开头 , 我 们 把 二 项 式 定 理 中 的 恒等式 当 作 微 分 对 象 . 请 证 明 二 项 式 定 理 . 


习题 11.7.5 ”推导 出 关于 (zi + x2 十 … 十 Xm)” 的 公式 , 并 给 出 证 明 . 
习题 11.7.6 sinz 在 0 点 附近 的 泰勒 级 数 是 


CO Ne zx2n-1 
1) Br 


利用 微分 恒等式 求 出 cosz 在 0 点 附近 的 泰勒 展开 式 . 
习题 11.7.7 ”不 明确 地 给 出 泰勒 级 数 的 具体 表达 式 , 只 利用 e” 的 性 质证 明 : e” 的 泰勒 级 数 
是 2 027/ml. 
习题 11.7.8 ”利用 泰勒 级 数 证 明 : > (一 = log2. 
习题 11.7.9 ”i 上 在 区 间 (一 1,1) 上 的 泰勒 级 数 是 于 oz" 这 个 级 数 在 该 区 间 上 是 一 致 收 
全 的 (所 以 和 的 导数 就 是 导数 的 和 ). 上 各 = 在 区 间 (一 1,1) 上 的 泰勒 级 数 是 什么 样 的 ? 
习题 11.7.10 ”回顾 > oz. 注意 , 如 果 把 这 个 和 分 成 %n<N 和 n> N, 那么 m> 的 
和 就 是 另外 一 个 几何 级 数 , 因此 我 们 可 以 将 无 限 和 转化 为 有 限 和 ! 试 着 这 样 做 , 并 证 明 对 
无 限 和 逐 项 求 导 是 正确 的 . 
习题 11.7.11 ”在 区 间 [0,2z] 上 , 并 2 ， sg = 2 王 =6g+2 二 利用 这 个 恒等式 证 明 : 并 ?2 ， 
Ts 
= ee 


习题 11.7.12 “利用 泰勒 级 数 证 明 : ez = cos(z) +isin(x). 


332 


第 11 章 


下 具 ; 


微分 恒等式 


习题 11.7.13 


习题 11.7.14 ” 泊 松 分 布 的 概率 函数 是 
Prob(X = n) = | 
求 泊 松 分 布 的 均值 . 
习题 11.7.15 。 求 泊 松 分 布 的 方差 


习题 11.7.16 
习题 11.7.17 
习题 11.7.18 


证 明 : 上 一 题 的 恒等式 理念 着 


求 负 二 项 分 布 的 方差 . 


六 用 全 0 
上 一 题 的 和 式 是 否 对 所 有 


Me ^/ml 
0 


曙 析 表达 式 .. 


的 均 收 敛 ? 证 


明 


若 ne{0,1,2,.……} 
其 他 . 


你 的 结论 . 


毕 达 哥 拉 斯 恒等式 : (sin? z + cos2 z 二 1). 


习题 11.7.19 ”假设 通货 膨胀 率 固定 在 每 年 5%, 也 就 是 说 , 现在 的 1 美元 在 一 年 后 的 价值 是 
1/1.05 美元 . 考虑 一 种 永 续 年 金 , 今年 支付 了 1 美元 , 并 且 每 年 都 比 上 一 年 多 支付 50 美 
分 , 一 直 这 样 持续 下 去 . 这 个 永 续 年 金 的 现 值 是 多 少 ? 

习题 11.7.20 ”想象 一 下 , 一 个 半径 为 工 的 钟 摆 从 与 垂直 方向 呈 30? 角 的 位 置 下 落 . 由 于 摩 
擦 力 的 作用 , 每 次 摆动 都 不 会 上 升 到 之 前 的 高 度 . 我 们 可 以 这 样 说 , 钟 摆 每 次 移动 所 ,其 
中 n 是 从 最 初 位 置 开 始 的 摆动 次 数 . 写 出 钟 摆 摆动 总 距离 的 表达 式 , 并 用 泰勒 级 数 来 近 
以 这 个 和 |. 

习题 11.7.21 。” 当 ne {1,2,… ,50} 时 , 画 出 六 ”2 一 的 图 形 , 并 给 出 直线 y = 2 在 相应 


区 域 上 的 图 形 . 简 述 级 数 的 收敛 性 . 


第 12 章 离散 分 布 


生活 与 我 们 的 语言 相悖 , 它 是 无 限 连续 的 、 微 妙 的 、 阴 了 瞳 的 ,而 我 们 的 语言 则 
是 离散 的 、 粗 糙 且 少 之 又 少 的 . 
一 一 威廉 ” 诬 姆 斯 ,《 宗 教 经 验 之 种 种 》(1902) 


章 的 目的 是 介绍 一 些 最 常见 和 最 重要 的 离散 分 布 (后 面 儿 章 会 考察 连续 分 
布 ). 这 些 分 布 之 所 以 受 欢迎 有 两 个 非常 好 的 原因 . 首先 , 它们 很 好 地 描述 了 许多 自 
然 现象 和 数学 现象 . 其 次 , 它们 在 数学 上 易于 人 处理 , 可 以 用 来 进行 很 多 运算 , 比如 计 
算 均 值 和 方差 , 以 及 求 相 互 独立 的 随机 变量 之 和 . 在 学 习 和 职业 生涯 中 , 你 会 一 次 
又 一 次 地 体会 到 易于 处 理 有 和 多么 重要 . 遗憾 的 是 , 大 多 数 情况 都 不 容易 处 理 . 想 要 
利用 问题 中 的 参数 来 得 到 漂亮 的 解析 表达 式 是 很 困难 的 . 但 为 什么 这 是 个 重要 的 
目标 呢 ? 如 果 能 得 到 一 个 用 参数 来 表示 的 答案 , 那么 你 就 可 以 轻松 地 看 到 参数 值 的 
变化 是 如 何 影 响 答案 的 . 
例如 , 经 济 模型 通常 非常 复杂 , 因为 必须 纳入 许多 复杂 的 影响 . 遗憾 的 是 , 通常 
无 法 得 到 用 输入 参数 来 表示 的 答案 , 因此 我 们 不 得 不 进行 数 百 万 次 模拟 . 这 意味 着 ， 
如 果 有 一 个 参数 发 生变 化 , 就 必须 重新 模拟 . 这 将 在 计算 方面 付出 昂贵 的 代价 . 如 
果 可 以 得 到 一 个 闭 型 解 , 那么 只 需要 把 新 值 代入 就 行 了 . 
我 们 先 考 察 伯 努 利 分 布 , 然后 考察 由 它 推广 而 来 的 几 种 分 布 , 并 在 最 后 给 出 其 
他 一 些 重 要 结果 . 在 第 7 章 中 , 我 们 曾 见 过 其 中 一 些 分 布 的 特殊 情形 , 所 以 应 该 对 
这 些 分 布 并 不 陌生 . 在 前 几 童 中 给 出 这 些 分 布 的 原因 是 , 当 没有 任何 具有 实际 意义 
的 例子 时 , 描述 概率 是 件 很 痛苦 的 事 . 在 接 下 来 的 几 节 中 , 我 们 将 更 深入 地 研究 这 
个 理论 及 其 应 用 . 


12.1 伯 努 利 分 布 


最 简单 的 离散 型 随机 变量 始终 取 同 一 个 值 . 当然 , 这 没什么 神秘 感 . 因此 , 我 们 
从 第 二 简单 的 情形 开始 : 它 只 取 两 个 值 (可 以 把 这 两 个 值 设 为 0 和 1). 


伯 努 利 分 布 : 如 果 随 机 变量 X 满足 Prob(X =1 =p 且 Prob(X=0=1-P， 
那么 X 就 服从 参数 为 pe [0,1] 的 伯 努 利 分 布 . 我 们 把 结果 1 看 作成 功 , 把 结果 
0 看 作 失 败 , 并 记 X ~ Bern(p). X 也 可 以 称 为 二 元 标示 随机 变量 . 
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记 住 , 随机 变量 只 取 实 数值 . 如 果 一 枚 硬币 括 出 正面 的 概率 是 p, 那么 随机 变量 
的 值 不 可 能 是 “正面 ”和 “反面 ”, 因为 它们 是 结果 空间 中 的 元 素 , 但 不 是 数 . 每 种 
可 能 的 结果 都 必须 与 一 个 数 相关 . 显然 , 这 种 做 法 的 好 处 是 , 可 以 把 数 加 起 来 . (两 
人 正面 与 一 个 反面 的 和 是 多 少 ? ) 结果 不 一 定 被 看 作 正 面 或 反面 ， 

人 下 南 或 不 下 南 , 队 
伍 胜 利 或 失败 , 等 等 . 每 当 看 到 一 个 随机 变量 时 , 你 都 应 该 迅速 算出 它 的 均值 和 方 
差 . 这 些 量 会 提供 很 多 信息 . 


定理 : 如 果 XX ~ Bern(p), 那么 X 的 均值 jx 等 于 p, 方差 o 是 p(1 一 p). 


上 面 的 结果 可 以 由 均值 和 方差 的 定义 得 出 : 


Lx =1:p+0:(1—p)= 7 

ox 二 (一 AUX) :p+(0— ux) (1—p) 
= (1—p)? .p+(-p)’(l—p) 
=p(1—p):(1 -p+p) = p(1— 7p). 


一 个 服从 伯 努 利 分 布 的 随机 变量 并 没有 太 多 用 处 . 但是, 如 果 考 虑 多 枚 硬币 ， 
或 者 不 断 地 重复 抛 撕 同 1 枚 硬币 , 那么 情况 就 会 发 生 很 大 的 变化 . 在 下 一 节 中 , 我 
们 会 讨论 与 之 相关 的 随机 变量 . 
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考察 二 项 分 布 的 方法 有 两 种 . 一 种 方法 是 , 我 们 有 n 枚 独立 的 硬币 , 并且 每 一 
枚 硬币 出 现成 功 的 概率 都 是 p. 同时 抛 丘 它们 , 并 记录 正面 出 现 的 次 数 . 另 一 种 是 ， 
我 们 可 以 抛掷 一 枚 人 硬币 ”次 , 然后 记录 正面 出 现 的 次 数 . 这 两 种 观点 都 很 有 用 . 
于 我 们 假设 了 硬币 的 独立 性 , 所 以 这 两 种 看 法 是 等 价 的 . 因为 每 次 抛 硬币 都 是 独立 
的 行为 , 所 以 抛 撕 n 枚 硬币 与 抛 撕 一 枚 便 币 ”次 没什么 区 别 . 


二 项 分 布 : 设 ”是 一 个 正 整数 , 并 设 pe [0,1]. 如 果 随 机 变量 X 满足 : 
{ee nls 若 k€ {0,1,.… ,n} 
Prob(X 
0 其 他 . 


那么 X 就 服从 参数 为 n 和 yp 的 二 项 分 布 , 并 记 X ~ Bin(n,p). X 的 均值 是 ny， 
方差 是 np(1 一 p). 
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我 们 要 确保 这 是 一 个 概率 分 布 . 有 两 点 需要 验证 : (1) 所 有 概率 都 是 非 负 的 ; 
(2) 概率 之 和 必须 等 于 1. 第 一 个 条 件 很 容易 验证 , 而 这 个 分 布 的 名 字 其 实 就 暗示 ] 
证 明 第 二 条 的 方法 . 这 个 分 布 叫 二 项 分 布 . 我 们 还 在 什么 地 方 听 过 二 项 这 个 词 ? 没 
普 , 二 项 式 系数 , 它 是 上 述 概率 定义 中 的 一 部 分 . 还 有 二 项 式 定理 , 我 们 会 在 A.2.3 
节 中 回顾 . 二 项 式 定 理 是 


现在 有 


>》 Piob( 半 二 (za = DD) 
k=0 k=0 
因此 第 二 个 条 件 成 立 , 这 的 确 是 一 个 概率 分 布 . 

到 目前 为 止 , 每 当 遇 到 一 个 随机 变量 时 , 你 都 应 该 自觉 地 求 出 它 的 均值 和 方差 ， 
这 就 是 在 上 述 定义 中 给 出 均值 和 方差 具体 取 值 的 原因 . 计算 均值 和 方差 的 方法 有 很 
多 种 . 如 果 直 接 利用 定义 计算 , 就 要 求 出 


Nn 


Hx = D(a ax = Dt) (pp 


k=0 


这 些 和 式 可 能 并 不 容易 计算 , 因为 它们 都 包含 了 二 项 式 系 数 . 但 是 , 有 几 种 强大 的 
技巧 可 以 求 出 它们 . 我 最 喜欢 的 技巧 之 一 是 微分 恒等式 法 , 在 11.3 节 中 , 我 们 利用 
这 种 方法 求 出 了 均值 与 方差 . 

现在 要 展示 另 一 种 方法 , 即 利 用 期 望 的 线性 性 质 ， 思 路 如 下 : 把 一 个 复杂 的 
随机 变量 分 解 成 一 些 简 单 且 相互 独立 的 随机 变量 之 和 . 如 果 X ~ Bin(n,p), 并 且 
Xi1,… ,Xn 是 相互 独立 且 均 服从 Ben(p) 的 随机 变量 , 那么 


二 


一 个 服从 Bin(n,p) 的 随机 变量 为 什么 与 ”个 相互 独立 且 服 从 Bern(p) 的 随机 变量 
之 和 一 样 呢 ? 实际 上 , 这 里 再 次 使 用 了 分 组 证 明 法 . 我 们 既 可 以 认为 同时 抛 撕 了 n 
枚 硬币 并 一 次 性 计算 正面 出 现 的 次 数 , 也 可 以 认为 依 顺 序 抛掷 了 次 , 然后 把 正面 
出 现 的 次 数 相 加 ， 
因为 每 个 X; 都 服从 Bern(p), 所 以 均值 都 是 jwx, = p, 方差 都 是 o% = p(1 一 p). 
现在 利用 期 望 的 线性 性 质 (参见 9.5 节 或 定理 9.6.2): 对 于 相互 独立 的 随机 变量 , 和 
的 期 望 值 就 等 于 期 望 值 之 和 , 和 的 方差 就 是 方差 的 和 . 因此 


Lx = ELX] 
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= EE[Xi 二 +.… 十 Xn 
= 下 [XI] 十 :… 十 正 [Xv] 


= 2 十 … 十 D = np, 


ax = Var(X) = Var(Xi+.…+ 0X,) 
二 Var(Xi1) 二 … 二 Var(Xn) 


=p(1—p)+…+p(l—p) = np(l—p). 


有 必要 花 些 时 间 来 庆祝 我 们 刚刚 完成 的 事情 : 我 们 找到 了 一 种 避免 计算 二 项 
式 系数 ( 乘 以 各 种 因子 ! ) 之 和 的 方法 . 我 们 把 一 个 难以 计算 的 和 简化 成 了 nn 个 较 
容易 计算 的 和 . 这 个 例子 又 一 次 说 明了 我 们 的 指导 原则 : 解答 大 量 简单 问题 要 比 解 
决 一 个 难题 好 得 多 . 

事实 上 , 我 们 所 做 的 事情 还 可 以 从 其 他 角度 来 考察 . 概率 论 和 组 合 学 中 最 强大 
的 技巧 之 一 是 用 两 种 不 同 的 方法 来 计算 . 通常 情况 下 , 一 种 计算 方法 会 比 另 一 种 更 
容易 , 而 这 能 让 我 们 求 出 男 一 种 方法 的 结果 . 利用 期 望 的 线性 性 质 还 有 个 额外 的 好 
处 : 可 以 证 明 一 些 关 于 二 项 式 和 的 定理 . 从 均值 的 计算 过 程 中 , 我 们 看 出 


Tn 
> k (0 prG -Pp ™* = np, 
| 


而 方差 的 计算 过 程 则 告诉 我 们 


Var(X) = > _(k—np)’ (za —p)" "= np(l—p). 


k=0 


这 种 思路 已 经 用 过 很 多 次 了 一 一 如 果 某 个 量 可 以 用 两 种 方法 来 计算 , 那么 我 们 只 需 
要 采用 其 中 一 种 方法 , 并 由 此 确定 另 一 种 方法 的 结果 . 

现在 我 们 可 以 解决 与 二 项 分 布 有 关 的 各 种 问题 了 . 回 到 赌博 问题 . 假设 要 抛掷 
4 颗 独立 的 仍 子 , 玩家 可 以 对 1 到 6 的 任意 一 个 数字 下 注 . 如 果 下 注 的 数字 出 现 了 
kk 次, 那么 玩家 就 顾 得 了 美元 , 其 中 大 在 1 和 4 之 间 取 值 . 如 果 该 数字 没有 出 现 ， 
那么 玩家 将 损失 1 美元 . 玩家 应 该 玩 这 个 游戏 吗 ? 

为 了 弄 清楚 该 不 该 玩 , 我 们 想 知道 预期 结果 . 这 个 词 提醒 了 我 们 应 该 计算 什么 . 
如 果 多 次 玩 这 个 游戏 , 那么 会 遍 钱 还 是 会 输 钱 ? 这 个 问题 可 以 通过 计算 期 望 值 来 回 
答 . 如 果 让 X 表示 当 抛掷 4 颗 独 立 的 均匀 骨 子 时 赢得 或 损失 的 钱 数 , 那么 X 的 可 
能 取 值 有 : -1 (下 注 的 数字 出 现 了 0 次 )、1 (下 注 的 数字 出 现 了 1 次 )、2 (下 注 的 数 
字 出 现 了 2 次 )……… 4. 现在 我 们 计算 每 一 种 情况 发 生 的 概率 : 
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lA 
oo 人 人 (的 - 浊 
ro 人 的 (人 (人 -名 
ene- -的 (加 
me 人 办- 吉 


现在 , 可 以 求 出 X 的 期 望 值 : 
625 125 25 5 1 239 
= (T1061+! 3412 360613 1 ~ 1296° 
由 于 期 望 值 是 正 的 , 因此 下 注 对 我 们 是 有 利 的 . 对 上 述 情 况 的 一 种 解释 是 , 从 平均 
水 平 看 , 在 玩 了 1296 次 后 , 我 们 预计 会 有 239 美元 的 收入 . 
下 面 的 代码 说 明了 我 们 可 以 玩 这 个 游戏 , 并 对 上 面 的 计算 结果 进行 了 验证 . 
diegame [numdo_] := Module[{}, 
winnings = 0; (* 记录 说 了 多 少 钱 *) 
For[n = 1, n <= numdo, n++,，(* 开始 主 循环 *) 
{ 
(* RandomInteger[{1,6}] 从 1 到 6 中 随机 挑选 1 个 数 *) 
(* 考虑 到 一 般 性 ， 可 以 假设 我 们 下 注 的 数字 是 1 *) 
(* 我 们 共 挑选 了 4 次 ， 并 将 1 的 个 数 保存 在 numrol1 中 *) 
numroll = Sum[If [RandomInteger[{1, 6}] == 1, 1, 0], {i, 1, 4}]; 


[xX 


If [numroll == 0, winnings = winnings - 1， 
winnings = winnings + numrol1]; (* 相应 地 调整 赢 钱 数 *) 
}]; (* 结束 对 n 的 循环 *) 


Print["Expected value is 239/1296 or about ", 239/1296.0, "."]; 
Print["Average winnings is ", 1.0 winnings / numdo, "."]; 
] 


在 进行 了 100 000 000 次 试验 后 (这 是 个 非常 简单 的 程序 , 所 以 我 们 可 以 做 大 
量 试验 ), 它 给 出 了 结果 : 


Expected value is 239/1296 or about 0.184414. 


Average winnings is 0.184213 . 
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推广 伯 努 利 分 布 的 方法 有 若干 种 . 我 们 得 到 的 第 一 个 结果 是 二 项 分 布 , 用 来 
究 这 种 情况 : 我 们 进行 多 次 独立 重复 的 试验 , 并 且 每 次 试验 都 有 两 种 可 能 结果 . 对 
于 所 有 试验 来 说 , 每 种 结果 出 现 的 概率 都 是 一 样 的 . 你 可 以 把 这 个 过 程 想 像 成 抛掷 
硬币 , 或 者 在 只 有 两 种 选择 的 选举 中 投票 . 显然 , 只 有 两 种 选择 是 相当 有 限 的 , 这 
表明 了 我 们 应 该 把 二 项 分 布 进一步 推广 到 多 项 分 布 . 与 二 项 分 布 一 样 , 多 项 分 布 考 
虑 的 是 进行 多 次 独立 重复 的 试验 , 并 且 每 种 结果 在 任意 一 次 试验 中 发 生 的 概率 都 相 
同 . 但 是 , 如 果 每 次 试验 有 两 种 以 上 的 可 能 结果 , 那么 多 项 分 布 将 给 出 不 同 结果 的 
概率 . 这 是 很 有 用 的 , 因为 现实 生活 中 经 常 出 现 两 种 以 上 的 可 能 结果 ! 

假设 我 们 进行 了 n 次 试验 , 并 且 每 次 试验 有 个 互 不 相 容 的 结果 , 其 概率 分 
别 是 pi,p2,… ,pr. 让 f(z1, x2,… ,Zk) 表示 在 这 n 次 试验 中 , 第 i 种 可 能 的 结果 
出 现 了 zx; 次 的 概率 , 其 中 1 < i < .我 们 一 定 有 zi 十 x2 十 … 十 Xk 二 mn. 为 
了 求 出 f(x1,z2,… ,zk), 首先 注意 到 , 按照 某 种 特定 顺序 得 到 这 些 结果 的 概率 是 
p71p3?… px*， 现在 来 计算 能 够 得 到 这 些 结果 的 可 能 顺序 有 多 少 种 . 第 1 种 结果 出 
现 ea 次 的 方法 有 (”) 种 , 第 2 种 结果 出 现 z2 次 的 方法 有 ("-=) 种 , 依 此 类 推 
第 大 种 结果 出 现 zk 次 的 方法 有 ("= 一) 因此 , 排序 方法 的 总 数 为 


nN NnN— Xl1 Nn 化 1 TX2 A Tk—1 
TX1 To Tk 


nl (nC— Zz1)! (no—z1 oo vk 1)! 


(nC— x1)!z1! | ( 见 一 021 一 Z2)!lz2! (nC— £1 oo TR) Lk! 


通过 约 分 , 现在 只 剩 下 了 


a (12.1) 


Z11221 .08 


式 (12.1) 被 称 为 多 项 式 系数 , 记 作 


) 
C1, C2 ,Tk 


在 6.2.2 节 中 , 当 考 察 重新 排列 一 个 单词 的 字母 , 进而 构造 出 新 单词 时 , 我 们 见 到 过 
这 些 系 数 . 请 参阅 该 部 分 内 容 , 以 获得 上 述 展开 式 的 另 一 种 推导 方法 . 利用 多 项 式 
系数 , 我 们 看 到 


要 
天 


nl 


f(T1, Za，… ,Tn) = a "> 


ZT1lz2l: 
这 是 一 个 多 项 分 布 . 我 们 经 党 写成 f(z1,z2,… ,zn; pi1;p2,… ,Pk), 从 而 强调 该 分 
布 对 参数 的 依赖 性 (参数 通常 会 放 在 分 号 的 后 面 ). 
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当然 , 应 该 说 明 上 述 概率 和 为 1, 这 样 才能 真正 确保 它 是 一 个 概率 分 布 . 我 鼓 
励 你 这 样 做 . 另外 , 也 可 以 从 组 合 学 的 角度 来 说 明 其 概率 和 必须 为 1. 我 们 有 一 系 
列 独 特 且 详尽 的 选择 . 最 后 , 我 们 会 通过 对 一 组 二 项 分 布 进行 分 组 来 得 到 多 项 分 布 . 
因为 其 中 每 个 都 是 分 布 , 所 以 多 项 分 布 也 是 如 此 . 

我 们 也 可 以 通过 重复 使 用 二 项 式 定理 和 分 组 方法 来 导出 多 项 分 布 . 例如 ， 当 
k 二 3 时 , 一 共有 三 种 结果 , 不 妨 设 为 4A, B 和 C. 我 们 可 以 合并 B 和 C, 并 考虑 只 
有 两 种 结果 的 情况 : 4 和 非 4. 如 果 让 pi 等 于 4 的 概率 , 让 1 一 pi 等 于 非 4 的 概 
率 , 那么 4 出 现 zi 次 且 非 4 出 现 ”- 2z1 次 的 概率 就 是 


Nn ZT1 人 也 一 全 
1 一 了 
的 。 ( p1) 


设 po 是 结果 B 的 概率 , ps 是 结果 C 的 概率 . 如 果 已 知 4 不 发 生 , 那么 B 发 生 的 
概率 就 是 名， C 就 是 注意 , 这 些 是 条 件 概 率 , 它们 的 和 之 所 
以 等 于 1 是 因为 5 举 十 ze 一 


p3 
D2 十 D3” 


因此 , 结果 4 出 现 zi 次、 结果 B 出 现 za 次 且 结 果 C 出 现 zs = 二 nn 一 zi 一 xz2 


次 的 概率 就 等 于 
nNn— zi Do 2 D3 1 一 21 一 Z2 
1 一 bs 
( Z2 ) (se) (5 ) py 


的 站 
TX1 


注意 , 当 za 遍历 0 到 n 一 zi 时 , 由 二 项 式 定理 可 知 , 括号 内 表达 式 的 连 加 和 就 等 
于 1. 这 并 非 偶然 , 它 与 我 们 的 展开 式 有 关 (人 东信 4 和 非 4 开始 的 ). 


利 1—pi i 十 D3 和 GC) (C33!) 一 i 可 以 进 一 步 简 化 这 个 式 子 ， 于 : 
是 得 到 了 
nl 1 ed 和 
1P1 Pp2”p3 


Z1!721731 


这 与 上 述 结果 一 致 . 把 我 们 的 发 现 分 离 出 来 , 就 会 得 到 以 下 结果 . 


多 项 分 布 与 多 项 式 系数 : 设 n,k 是 正 整 数 且 pi,p2,… ,pn € [0,1] 满足 pi 十 … 十 
pn 二 1. 设 zi1,… ,zn ET{f01 ,n} 满足 zi 十 … 十 zn = 二 n. 那么 , 相应 的 多 项 


式 系数 就 是 
Nn | nl 
ZT1, To ,Tk Za 


且 其 余 zx; 的 值 都 为 0， 仅 当 (z1,… ,zx) 满足 上 述 条 件 时 , 参数 为 n、k 和 
D1,… ,pk 的 多 项 分 布 才 不 为 0, 其 概率 密度 函数 为 


k 


nN St 人 
p1 Po2 2DK ， 
T1,T2,°** ,Tk 


记 作 X ~ Multinomial(n,k,p1,:… ,px). 
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多 项 分 布 不 同 于 我 们 见 过 的 其 他 分 布 . 我 们 会 得 到 一 个 n 元 组 , 而 不 是 一 个 值 . 
可 以 把 它 看 成 二 项 分 布 来 理解 其 相关 性 质 . 例如 , 如 果 


X ~ Multinomial(n, k,p1,:.. ,pxk), 


那么 可 以 构造 随机 变量 X;, 表示 结果 i 出 现 的 次 数 . 现在 就 得 到 了 X; ~ Bin(n,p;). 
此 时 , 我 们 只 关心 是 否 得 到 了 结果 i (结果 i 发 生 的 概率 是 p;, 不 发 生 的 概率 是 
1 一 pi;). 因此 , px = pi 且 OX, = nipi(l — pi). 

F 面 的 问题 是 本 课程 的 经 典 问题 之 一 . 考虑 一 个 钢 子 , 里 面 装 满 了 三 种 美味 可 
的 饼干 : 巧克力 薄片 、 涂 鸦 饼干 和 糖 饼 . 假设 饼干 的 数量 实在 太 多 了 , 即便 扔 掉 
其 中 一 些 也 无 关 紧 要 , 拿 到 另 一 种 饼干 的 可 能 性 不 会 发 生 改变 . 拿 到 一 块 巧 克 力 注 
片 的 概率 是 45%, 拿 到 一 块 涂鸦 饼干 的 概率 是 30%, 拿 到 一 块 糖 饼 的 概率 是 25%. 
在 随机 拿 到 的 6 块 饼干 中 , 有 三 块 巧 克 力 薄片 、 两 块 涂鸦 饼干 和 一 块 糖 饼 的 概率 是 
多 少 ? 如 果 你 不 喜欢 这 种 近似 (因为 现在 取 到 一 块 巧克力 薄片 一 定 会 影响 下 次 取 到 
巧克力 薄片 的 概率 ), 那么 可 以 把 这 个 问题 看 作 有 放 回 取样 .这 意味 着 我 们 会 逐次 
取出 6 块 饼干 , 每 次 都 记录 下 饼干 的 类 型 , 然后 立即 把 饼干 放 回 炙 子 里 . 

解答 : 对 于 具有 多 种 可 能 性 的 问题 , 你 不 必 感 到 奇怪 , 这 是 个 多 项 分 布 的 例子 . 
我 们 有 pl = 0.45, pa = 0.30 和 ps = 0.25. 已 知 的 值 有 n= 6, zl = 3, za = 2 和 
x3 一 1. 于 是 


6! 
Pr(X1 = 3, Xo = 2, Xs = 1) so (045) (0.30) (0.25) ~ 0.123. 


在 本 章 末尾 , 我 们 会 给 出 一 些 额 外 的 问题 (例如 , 习题 12.8.29). 


12.4 几何 分 布 
接 下 来 的 分 布 也 是 由 伯 努 利 分 布 推广 而 来 的 ， 回想 一 下 服从 伯 努 利 分 布 的 随 
机 变量 , 它 把 成 功 的 概率 指定 为 p, 失败 的 概率 指定 为 1 -~ p. 我 们 现在 要 做 的 是 不 
断 重复 这 个 试验 , 直到 首次 成 功 为 止 . 另外 , 用 随机 变量 X 表示 首次 成 功 时 已 经 完 
成 的 试验 次 数 . 我 们 称 X 是 一 个 服从 几何 分 布 的 随机 变量 . 


几何 分 布 : 设 pe [0,1]. 如 果 随 机 变量 X 满足 


p(1 —p)"™! 若 ne {1,2,3,.…} 
0 其 他 ， 


那么 X 就 服从 参数 为 p 的 几何 分 布 , 并 记 作 X ~ Geom(p). 它 的 均值 为 1/p, 方 
差 为 壕 . 


Prob(X =n)= | 


©O 
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首要 任务 是 证 明 这 的 确 是 一 个 分 布 . 概率 显然 是 非 负 的 , 所 以 现在 只 需要 证 明 
概率 和 为 1 就 行 了 . a 人 1.2 贡 中 , 我 们 讨论 并 证 明了 这 


个 公式 ): 如 果 |r| < 1, 那么 > 


0 


这 样 就 完成 了 证 a 


现在 来 计算 均值 , 它 会 更 复杂 一 些 ， 微 分 恒等式 法 是 计算 均值 的 好 方法 .在 


11.1 节 中 ， 我 们 六 和 用 这 种 方法 各 地 求 出 了 均值 . 现在 给 出 另 一 种 证 明 方 法 . 这 


节 中 篮球 竞赛 的 分 析 过 程 非常 相似 . 关键 的 想法 是 利用 无 记忆 过 


程 (你 也 可 以 利用 问题 中 的 一 些 对 称 性 ). 
用 jx 表示 均值 . 我 们 有 


这 个 公式 是 怎么 得 到 的 ? 回顾 1.2 节 的 篮球 问题 , 我 们 可 以 用 一 个 非常 相似 的 论证 
第 1 次 试验 成 功 的 概率 是 2. 如 果 现 在 就 结束 了 , 那么 随机 变量 的 值 就 是 
1. 因此 , 上 式 中 的 1.p 是 根据 “随机 变量 取 1 时 的 概率 为 p” 这 一 事实 得 来 的 . 那 


来 推导 


么 其 他 


因子 是 
均值 , 所 以 从 现在 开 


(ux + 1)(1— 


况 的 概率 . 现在 来 计算 ux, 它 满足 


这 说 明了 pux = 1 或 者 jx = 1/p, 恰好 与 之 前 所 说 的 一 样 ! 


1 


种 方法 更 有 助 于 解 题 


Lx=1:p+ (ux+1):(1—pn). 


怎么 得 到 的 ? 这 个 问题 更 有 趣 . 假设 第 1 次 试验 失败 , 这 件 事 发 生 的 


p). 这 里 的 十 1 是 


(1— 


旦 失败 了 , 一 切 好 像 就 会 从 头 开 始 ， 因 为 我 们 用 jx 表示 
始 直到 首次 成 功 , 预计 要 进行 jx 次 试验 . 因此 , 由 均值 可 得 


因为 第 1 次 试验 失败 了 , 而 (1 一 p) 表示 发 生 这 种 情 


(1—p))ux =p+(1—p), 


用 不 同 的 方法 来 证 明 同 一 个 结果 是 非常 好 的 ， 有 时 候 , 一 种 方法 会 比 另 一 
, 或 者 只 是 让 我 们 更 容易 明白 . 作为 一 个 不 错 的 练习 , 试 着 用 


这 种 方法 来 计算 方差. 我 觉得 利用 微分 恒等式 法 求 方差 会 更 容易 , 其 公 \ 式 为 o2 = 


[和 3] 一 


[和 ]2. 


假设 一 个 鲜 子 里 有 P 颗 紫 


示 变 量 ， 


色 的 球 和 y 颗 黄 色 的 球 (虽然 可 以 用 任何 字母 来 表 


晶 使 用 与 单词 有 明确 关联 的 字母 是 个 不 错 的 选择 , 因为 这 样 更 容易 记 住 它 


用 


a 


然后 再 


区 


次 取 到 1 颗 紫 1 
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E 它 放 回 久子 


们 都 代表 了 什么 ). 从 刍 子 中 随机 地 取 球 , 每 次 取出 1 颗 球 后 , 我 们 会 


色 球 的 概率 都 是 一 样 的 : 始终 是 p/(p 十 四 . 于 是 


Prob(D > m) 


因为 现在 是 有 放 回 抽检 


下 1 颗 球 . 在 取 到 第 1 颗 紫 色 球 之 前 , 至 少 要 取 m 次 的 概率 是 多 少 ? 
让 D 表示 得 到 1 颗 紫 色 球 所 需 的 抽取 次 数 . 


lf 所 以 每 


0 
p+y \p+y p+y \p+y 
Co ?一 工 
7 y 
2 
和 | 
p+y \p+Y 也 十 和 
( y ) 
D 十 Y 
12.5 ” 负 二 项 分 布 


警告 : 如 果 你 认为 指数 型 随机 变量 的 定义 很 不 好 , 那 接 下 来 的 情况 会 更 糟 . 问 


题 在 于 , 不 同 的 教材 对 负 二 项 分 布 的 定义 有 不 同 的 约定 : 有 些 人 文 持 从 0 开始 ， 


他 人 支持 从 1 


定 要 小 心 . 需要 
通过 强调 儿 个 词 , 我 们 来 说 明 下 个 推广 . 从 一 个 服从 伯 努 利 分 布 的 随机 变量 
功 ) 的 概率 是 p, 折 出 反面 ( 即 失败 ) 的 概率 为 


始 : 抛 丘 一 枚 硬币 , 掷 出 


仔细 检查 这 些 教材 使 用 的 标准 形式 是 什么 . 


其 


一 


始 ; 有 些 人 用 p 表示 成 功 的 概率 , 其 他 人 用 p 表示 失败 的 概率 . 所 
你 把 本 书 中 的 公式 与 其 他 教材 (或 计算 机 程序 包 ! ) 中 的 公式 进行 比较 时 , 一 


甸 ( 即 成 


1 一 p. 通过 不 其 避 
几何 分 布 的 随机 变量 . 接 下 来 , 我 们 很 自 
到 出 现 第 2 次 成 ] 


币 直 到 第 1 次 成 功 为 ] 
然 地 想到 , 如 有 果 不 
功 、 第 3 次 成 功 或 第 > 次 成 功 为止 , 情况 又 是 怎 术 


E 复 抛 撕 同 一 枚 硬 


构造 一 个 随 


几 放生 


XX, 用 来 计算 第 ” 次 成 功 时 已 经 抛掷 了 多 少 次 硬 


我 们 来 ) 


[SN 


有 Prob(X = m) = 0. 这 是 


至 少 需要 抛 拉 


n 次 抛掷 中 , 恰好 取得 了 > 次 成 功 . 另外 , 最 后 1 次 掷 昌 
在 前 n 一 1 (或 更 少 ) 次 抛掷 


下 它 的 概率 密度 函数 . 如 果 n 
因为 X 只 能 取 整 数值 , 并 且 
7 次 . 现在 只 需要 考虑 n > ” 时 的 概率 . 


3 


如 果 丈 
我 们 来 看 一 


上 , 我 们 得 到 了 一 个 服从 
新 地 抛掷 同一 枚 硬币 , 直 


的 ? 因此 , 可 以 
币 . 


不 是 整数 或 者 n < 7 一 1, 那么 一 定 
得 了 7 次 成 ] 
下 这 种 人 
的 结果 一 定 是 成 功 的 , 否则 
P 就 已 经 获得 了 7 次 成 功 , 而 我 们 想 求 的 


内 ,那么 
况 . 在 


是 只 需要 抛掷 


恰好 成 功 了 


n 次 就 可 以 获得 7 次 成 功 的 概率 . 概括 一 下 : n 宕 7, 在 前 n 次 抛掷 9 


次 ， 
前 nn 一 1 次 


并 且 最 后 一 次 是 成 功 的 . 这 意味 着 在 前 - 1 次 抛掷 9 
FP 选 出 成 功 的 7 一 1 次 共有 
n 一 7 次 失败 , 而] 


恰好 成 功 


(1) 种 方法 . 每 和 
其 概率 为 mr(1 - p)"-". 把 所 有 情况 都 考虑 进来 


了 7 一 1 次 . 从 


h 选 法 都 包含 7 次 成 功 和 


就 得 到 了 


人 若 mnE{frr+lr 二 2…} 
Prob(X = n)= 7—1 
0 其 他. 

遗憾 的 是 , 这 并 不 是 负 二 项 分 布 的 定义 , 但 已 经 非常 接近 了 . 在 数学 中 , 一 个 符 
号 或 一 个 定义 通常 可 以 用 好 几 种 方法 来 表示 . (有 些 ) 人 们 不 考虑 成 功 的 次 数 , 反而 
会 计算 失败 的 次 数 , 原因 是 这 种 看 法 在 实际 应 用 中 会 更 自然 . 如 果 想 知道 一 件 设备 
能 使 用 多 久 , 那么 考察 失败 的 次 数 要 比 计算 成 功 的 次 数 更 实际 . 另外 , 我 们 不 考虑 
出 现 > 次 失败 时 一 共 抛 搓 了 多 少 次 , 而 是 计算 出 现 ”> 失败 之 前 一 共 获 得 了 多 少 次 
成 功 . 我 们 用 表示 成 功 的 次 数 , 它 必 须 是 非 负 整数 . 正如 我 们 在 本 节 开 始 时 所 说 
的 那样 , 存在 很 多 略 有 不 同 的 表述 , 这 让 人 非常 头疼 , 但 事情 就 是 这 样 , 当 你 查看 其 
他 材料 时 必须 小 心 . 

我 们 采用 与 之 前 相似 的 方法 来 论证 . 如 果 恰 好 出 现 了 天 次 成 功 和 > 次 失败 , 那 
么 一 共 抛 括 了 KE+r 次 . 此 外 , 最 后 1 次 的 结果 一 定 是 失败 , 所 以 在 前 有 +Tr 一 1 次 抛 
掷 中 共有 大 次 成 功 . 对 于 出 现 了 次 成 功 和 7 次 失败 的 任意 一 种 结果 , 其 概率 均 为 
(1 一 p)", 那么 当 第 7 次 失败 时 恰好 获得 了 大 次 成 功 的 概率 就 是 (etr-Dm(1_ 丰 7 
这 就 是 负 二 项 分 布 . 

负 二 项 分 布 : 设 > 是 一 个 正 整数 , 并 且 p €& [0,1]. 假设 抛掷 一 枚 硬币 获得 成 功 
(出 现 正面 ) 的 概率 是 p. 随机 变量 X 表示 当 恰好 出 现 * 次 失败 (出 现 反面 ) 时 已 
经 成 功 的 次 数 . X 服从 参数 为 > 和 yp 的 负 二 项 分 布 . 它 的 概率 密度 函数 为 


(sm 若 k€ {0,1,2,.…} 
Prob(X = 有 = k 

0 其 他 ， 
记 作 和 ~ NegBin(7,p). 它 的 均值 为 否 ;, 方差 为 Te 


直接 把 概率 相 加 就 可 以 证 明 概 率 和 为 1. 利用 一 般 情形 下 的 二 项 式 定 理会 是 个 
不 错 的 办 法 , 其 中 指数 不 一 定 是 正 整数 . 现在 不 使 用 这 种 方法 , 而 是 采用 故事 证 明 
法 (有 关 故 事 证 明 法 的 更 多 内 容 , 请 参阅 A.6 节 ). 

每 当 你 看 到 一 个 复杂 的 公式 时 , 如 果 可 以 找到 一 种 特殊 情形 , 那 就 对 它 进行 验 
证 吧 ! 现在 有 一 种 可 以 进行 验证 的 情形 ， 不妨 设 > = 1, 并 设 成 功 的 概率 p 等 于 
1 一 g (所 以 , 失败 的 概率 1 一 p 就 等 于 g)， 在 这 种 情况 下 , 我 们 要 计算 当 出 现 失败 
( 即 掷 出 反面 ) 时 已 经 成 功 的 次 数 , 其 中 失败 (即便 币 掷 出 反面 ) 的 概率 是 g. 如 果 整 
数 天 > 0, 那么 这 样 的 情况 共有 


(i 0-00 a- 


种 . 
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这 看 起 来 并 不 陌生 , 很 像 一 个 成 功 概率 为 4 的 几何 分 布 的 概率 密度 函数 . 不 同 
的 是 ,大 代表 的 是 成 功 的 次 数 , 而 不 是 抛掷 的 总 次 数 . 让 1 = 十 1 表示 抛掷 的 总 次 
数 , 它 对 应 的 随机 变量 用 工 来 表示 . 那么 , 当 1 是 非 负 整数 时 , 我 们 有 


Prob(L=/)= a(1— gq) ,, 


这 与 服从 几何 分 布 的 随机 变量 是 一 样 的 . 

给 出 这 个 计算 的 目的 是 想 告诉 你 如 何 验证 一 个 计算 的 合理 性 . 令 人 鼓舞 的 是 ， 
这 种 做 法 是 可 行 的 . 负 二 项 分 布 是 由 几何 分 布 推广 而 来 的 , 这 一 点 非常 好 . 当然 , 重 
要 的 是 要 把 事情 看 清楚 . 对 于 这 里 的 成 功 , 我 们 不 必 过 于 兴奋 . 毕竟 , 这 是 一 种 非常 
特殊 的 情形 . 当 7 = 1 时 , 很 多 项 都 消失 了 . 所 以 , 尽管 这 确实 说 明 我 们 得 到 了 一 个 
概率 分 布 , 但 并 不 是 证 明 . 

好 了 , 现在 该 求 均值 了 ! 这 是 一 项 艰巨 的 任务 , 因为 要 计算 


Hx = > rl Ss 


如 果 仔 细 观 察 一 下 , 我 们 最 终 可 能 会 把 和 p* 结合 起 来 , 进而 得 到 kp*. 这 意味 着 
要 使 用 艺 (或 者 p 艺 ), 因为 这 样 就 可 以 消去 一 个 . 换 旬 话说 , 微分 恒等式 法 可 能 
是 个 不 上 的 过 就 像 我 们 以 前 说 过 的 那样 , 有 一 个 解析 表达 式 是 很 棒 的 , 但 往往 
很 难 找 到 . 通常 , 我 们 必须 非常 巧妙 地 改 写 代数 运算 才能 找到 可 以 有 效 处 理 的 表 
达 式 . 

我 们 从 已 知 的 唯一 关系 开始 , 即 和 为 1, 然后 继续 进行 下 去 . 


TSY 


= 
Dl -号 (人 “一 2 
| (bp —p)" — rp*(1 —p)"™!) 
k=0 
-2 WE sd or- 


现在 把 负 项 移 到 另 一 端 , 得 到 


k=0 k=0 
rp De 污 于 _ 亡 大 十 7 一 1 A 
证 ( ) (一 中 > 人 
0 k=D 
注意 , 等 号 左 端 的 和 是 1 (因为 负 二 项 分 布 是 概率 分 布 ), 而 等 号 右 端的 和 就 是 均值 . 
于 是 
rp 
HX = : 
1—p 


我 鼓励 你 按照 类 似 的 方法 来 计算 方差 . 

我 喜欢 上 述 用 微分 恒等式 法 给 出 的 证 明 . 仔细 想 一 下 , 我 们 知道 的 唯一 恒等式 
就 是 “和 为 1”, 所 以 对 该 式 求 微分 是 很 合理 的 . 还 有 其 他 计算 均值 的 方法 吗 ? 非常 
幸运 , 有 ! 但 这 种 方法 有 点 复杂 , 它 的 思路 类 似 于 计算 几何 分 布 的 均值 的 无 记忆 证 
明 , 我 们 来 试 一 试 吧 . 

我 们 的 目标 是 证 明 : 如 果 X ~ NegBin(7,p), 那么 jx = 这 就 要 对 7 进 
行 归纳 . 首先 考虑 最 基本 的 情况 ， 当 x = 1 时 , 前 面 已 经 证 明了 NegBin(1,p) 和 
Geom(1 一 p) 的 概率 密度 函数 几乎 相同 , 它们 之 间 只 相差 1. 准确 地 说 , 如 果 X 服 
从 负 二 项 分 布 , G 服从 几何 分 布 , 那么 X +1= G. 因为 参数 为 1 一 p 的 几何 分 布 的 
均值 是 二, 所 以 NegBin(1,p) 的 均值 就 是 让 一 1= 吉 . 这 样 就 完成 了 对 最 基本 
情况 的 证 明 . 

对 于 参数 为 > 和 p 的 负 二 项 分 布 , 我 们 假设 上 述 结论 成 立 . 现在 进一步 证 明 当 
参数 为 7 十 1 和 p 时 , 结论 仍然 成 立 . 不 妨 设 心 和 jp 分 别 表示 NegBin(7,p) 
和 NegBin(7 十 1,p) 的 均值 . 通过 类 似 于 计算 几何 分 布 的 均值 时 所 做 的 论述 , 我 们 得 
到 了 


Hrtip = (Hrtipt Dp+ kr,p(l —D). 
为 什么 会 得 到 这 个 式 子 ? 记 住 , 我 们 希望 恰好 出 现 7 十 1 次 失败 , 并 且 想 求 出 成 功 
次 数 的 均值 ! 如 果 第 1 次 成 功 了 (发 生 的 概率 是 p), 那么 仍 需要 > 十 1 次 失败 . 这 
就 好 像 现在 重新 开始 了 这 一 过 程 , 但 要 记得 把 刚刚 获得 成 功 的 那 一 次 加 进来 , 即 加 
上 1. 如果 第 1 次 失败 了 , 那么 还 需要 7 次 失败 . 此 时 , 成 功 的 次 数 预计 是 jp. 注 
意 , 我 们 没有 像 之 前 那样 加 1, 这 是 因为 我 们 要 计算 成 功 的 次 数 , 但 第 1 次 失败 了 . 
由 归纳 假设 可 知 jy = 到, 把 它 代 入 上 式 可 得 


1—p}? 


Hr+li,p 一 (HUr+lp 下 1)p 十 Mr,p(l = p) 
(1—PDhrtip =Pp+7p 
(r++1)p 
1—p 


Hrti,p = 
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这 样 就 完成 了 证 明 . 
注 “ 在 写 第 二 部 分 的 证 明 时 , 我 犯 了 一 个 错误 . 我 没有 给 出 jp(1 一 p), 而 是 
给 出 了 (jwwp 十 1)(1 一 p). 这 导致 (1 一 pprrip= 工 +rp, 而 不 是 p+7rp. 有 一 点 非常 
好 , 我 清楚 地 知道 只 有 当 p+ 十 rp, 而 非 1 十 rp 出 现时 才 是 正确 的 . 这 提醒 我 回 过 头 
来 查找 哪里 出 现 了 错误 . 每 个 人 都 会 犯错 . 我 们 很 容易 忘记 一 些 事 , 或 者 把 一 些 代 
数 运算 处 理 得 很 糟糕 . 但 是 , 如 果 你 对 答案 有 一 定 的 感知 , 就 可 以 利用 这 一 点 来 保 
持 清晰 的 思路 . 
负 二 项 分 布 可 以 用 来 确定 一 个 系列 中 多 于 1 次 失败 的 概率 . 例如 , 假设 我 们 在 
抛 括 一 颗 仍 子 并 把 1 看 作 失 败 , 可 以 算出 当 出 现 一 定数 量 的 失败 时 抛掷 的 总 次 数 ， 
因此 , 如 果 我 们 想 看 到 7 个 1 (基于 某 种 原因 ), 那么 可 以 确定 出 现 7 次 失败 时 总 抛 
掷 次 数 的 平均 值 . 这 在 一 些 情况 下 是 很 有 帮助 的 . 比如 , 计算 一 台 机 器 彻底 骨 溃 前 
的 天 数 , 或 者 输 掉 系列 赛 冠军 需要 进行 多 少 场 比赛 . 
仓库 设备 的 有 效 性 就 是 个 很 好 的 例子 . 某 家 造纸 三 买 了 一 台 昂 贵 的 机 器 , 经 理 
想 知道 在 出 现 故 障 前 , 这 台 机 器 能 工作 多 长 时 间 . 如 果 机 器 每 天 正常 工作 的 概率 是 
98%, 且 与 另 一 天 无 关 , 并 且 在 机 器 彻底 无 法 使 用 之 前 会 出 现 5 次 故障 (这 是 机 器 
不 工作 的 几 天 ), 那么 在 机 器 彻底 崩溃 之 前 , 预计 可 以 使 用 多 少 天 ? 
解答 : 这 是 个 与 负 二 项 分 布 有 关 的 例子 . 负 二 项 分 布 有 很 多 , 我 们 要 通过 参数 来 
确定 与 哪 一 个 负 二 项 分 布 有 关 . 从 问题 给 出 的 信息 中 , 我 们 看 到 >= 5 且 p 
因此 Pr(X = 有 = (“+17 )p*(1 一 p)*, 由 公式 可 得 , 正常 使 用 天 数 的 期 望 值 是 
rp 5(0.98) 
M7 1-p 一 002 
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到 目前 为 止 , 我 们 研究 的 离散 分 布 都 与 伯 努 利 分 布 有 关 ， 接 下 来 的 例子 也 与 
伯 努 利 分 布 有 关 , 但 关联 并 不 是 那么 密切 . 虽然 我 们 可 以 定义 服从 泊 松 分 布 的 随机 
变量 , 但 它 其 实 可 以 被 定义 为 参数 为 n 和 p 的 二 项 分 布 的 极限 , 其 中 mn 一 co 是 
np 一 入. (我 不 喜欢 在 入 门 课 中 使 用 这 个 符号 , 因为 p 看 起 来 像 是 一 个 固定 的 数 . 我 
更 喜欢 写成 zw, 然后 令 np,, 一 入 避 励 读者 在 习题 12.8.20 中 尝试 这 种 写法 . 
泊 松 分 布 : 设 和 > 0. 如 果 随 机 变量 X 满足 
Xe ^/ml 若 ne {0,1,2,.…} 

| 其 他 . 


那么 X 就 服从 参数 为 和 的 泊 松 分 布 , 并 记 作 XX ~ Pois(A). X 的 均值 和 方差 都 


是 入 . 


一 245. 


— 


Prob(X =n)= 
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与 之 前 一 样 , 我 们 先 证 明 这 是 一 个 概率 分 布 . 概率 显然 是 非 负 的 . 为 了 看 出 概 
率 和 为 1, 我 们 利用 指数 函数 的 泰勒 级 数 公 式 : 


oe L 
全 
于 是 有 
2 和 me 一 
0 二 
LE 
运 丫 2 
一 er>xex = 1 


现在 继续 求 均值 ! 我 们 再 次 利用 微分 恒等式 法 . 已 知 的 唯一 恒等式 为 “概率 和 
为 1”, 因此 


ns,— 入 
] 二 入 上 
人 
d d 二 Me 
丙 : 2 nl 
ee 
0 te e “) 
二 > (nA le * XR) 
Ane-X Ane-^ 
= >, | 人 1 
n=0 n=0 


等 号 右 端 的 最 后 一 个 和 等 于 1, 因为 它 是 泊 松 分 布 的 概率 和 . 另外 , 最 后 一 行 的 第 一 
个 和 是 jx. 因此 


HX 三 入 ， 


这 样 就 完成 了 证 明 . 
方差 可 以 按照 类 似 的 方法 来 计算 . 建议 你 自己 做 一 下 , 以 确保 熟练 掌握 该 方法 . 
O 假设 今天 进入 邮局 的 顾客 数 服从 参数 为 入 = 1/3 的 泊 松 分 布 . 今天 至 少 有 一 位 
顾客 进入 邮局 的 概率 是 多 少 ? 
解答 : 如 果 用 X 表示 今天 进入 邮局 的 顾客 数 , 那么 要 算 的 就 是 Prob(X > 1). 
如 果 直接 计算 这 个 值 , 就 必须 求 出 X 等 于 1、2 或 3 等 的 概率 . 此 时 , 我 们 必须 分 
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析 大 量 情形 , 并 求 出 无 限 和 . 在 这 种 情况 下 , 计算 某 件 事 不 发 生 的 概率 通常 要 容易 
很 多 , 而 事件 发 生 的 概率 就 等 于 1 减 去 没有 发 生 的 概率 . 没有 人 进入 邮局 的 概率 就 
是 X 等 于 0 的 概率 , 即 (1/3)oe-LY3/0L = e-13. 因此 


Prob(X >1) = 1— Prob(X =0) = 1—e-!/3 0.283. 


和 往常 一 样 , 如 果 你 能 写 一 些 简 单 的 代码 来 验证 答案 , 那 是 很 有 价值 的 . 很 多 
系统 都 有 预定 义 函 数 , 并 允许 你 从 标准 随机 变量 中 取样 . 希望 你 能 利用 这 一 点 . 
poissonpostoffice [numdo_] := Module[{}, 

count = 0; (* 成 功 次 数 的 计数 *) 

For[n = 1, n <= numdo, n++, 

{ 
(* 由 参数 为 1/3 的 泊 松 分 布 随机 生成 *) 
x = Random[PoissonDistribution[1/3]]; 


If[x > 0, count = count + 1]; 
外 ; (* 结束 对 n 的 循环 *) 
Print["Theory predicts probability customer is "， 
100. (1 - Exp[-1/3]), "."]; 
Print["Observed probability is ", 100. count/numdo, "."]; 
] 
运行 10 000 000 次 试验 (我 被 困 在 了 机 场 , 有 充足 的 时 间 ) 的 结果 是 : 
Theory predicts probability customer is 28.3469 . 
Observed probability is 28.3239. 
现在 我 们 来 考虑 另外 一 类 问题 . 假设 宜家 公司 从 过 去 的 经 验 中 了 解 到 , 某 家 特 
定 商 店 每 天 出 售 的 床 的 数量 服从 参数 为 = 1/2 的 泊 松 分 布 . 这 家 商店 今天 卖 出 不 
超过 3 张 床 的 概率 大 概 是 多 少 ? 
在 上 一 个 问题 中 , 我 们 求 出 了 事件 没有 发 生 的 概率 , 并 用 1 减 去 这 个 概率 . 这 
样 做 是 为 了 避免 计算 无 限 和 . 在 这 个 问题 中 , 因为 只 需要 考虑 4 种 可 能 的 情况 ( 即 
卖 出 了 0、1、2 或 3 张 床 ), 所 以 可 以 直接 计算 . 设 B 是 商店 今天 卖 出 的 床 的 数量 ， 


那么 
1NTerl2 Nier /liVe YW? 1N el 
(3) 0! G3) 1! + (3) 21! + (3) 3! 


0.998. 


Prob (B < 3) 


| 


2 


最 后 , 我 们 给 出 关于 泊 松 分 布 的 一 个 高 级 注释 . 均值 和 方差 都 等 于 和 起 初 看 
起 来 好 像 有 些 奇怪 , 因为 这 可 能 意味 着 均值 和 方差 具有 相同 的 单位 (并 不 是 这 样 的 . 
一 般 情况 下 , 均值 与 标准 差 的 单位 是 相同 的 ). 这 是 怎么 回 事 呢 ? 记 住 , 概率 密度 函 
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数 是 Pr(X = n) = er->X/nl 如 果 入 有 单位 , 那么 e-^ 就 没有 意义 了 , 这 是 因为 
e- > 就 等 于 1 上 + 入 + X2/21 二 X3/3! 十 .…, 这 将 要 求 各 种 不 同 的 表达 式 具 有 相同 的 单 
软 的 , 会 导致 入 和 X2 具有 相同 的 单位 . 


位 . 这 是 很 充 户 


12.7 ”离散 均匀 分 布 
现在 考察 对 伯 努 利 分 布 的 最 后 一 种 推广 . 记 住 , 伯 努 利 分 布 有 两 种 可 能 的 结果 . 
我 们 考虑 p = 1/2 的 特殊 情形 , 此 时 两 种 结果 是 等 可 能 的 . 一 种 自然 的 推广 是 : 有 
n 个 可 能 的 结果 , 并 且 每 个 结果 发 生 的 概率 都 是 1/n，( 注 意 , 这 与 只 有 一 个 结果 且 
所 有 概率 均 相 等 的 多 项 分 布 相同 .) 


离散 均匀 分 布 : 设 {a1,a2,… ,an} 是 一 个 有 限 集 . 如 果 XX 满足 


1/n 若 a € {al,a2,:… ,an} 
0 其 他 . 


那么 X 就 是 一 个 服从 离散 均匀 分 布 的 随机 变量 . 最 重要 的 一 种 情况 出 现在 上 述 
集合 为 {a,a 十 1,a 十 2,… ,a 十 n 一 1} 时 .此 时 , X 的 均值 为 a 十 号!:, 方差 为 


n2—1 
于 区 


这 个 均值 很 容易 计算 : 只 要 把 所 有 值 都 加 起 来 , 然后 再 除 以 ”就 行 了 . 如 果 我 
们 停 下 来 思考 这 里 的 代数 运算 , 那么 问题 解决 起 来 会 更 加 轻松 . 当 a = 0 时 , 均值 
更 加 简单. 只 要 让 这 个 均值 加 上 a, 就 可 以 求 出 一 般 情况 下 的 均值 . 于 是 , 这 个 均值 


Prob(X = oa) 三 | 


n—1 
1 1 (n— 1)n n—1 
Es k = 一 | S 
We Qe 5 a 5 


这 里 利用 了 求 连续 整数 和 的 公式 (参见 A.2.1 节 ). 方差 的 计算 方法 与 之 类 似 , 关键 
是 要 利用 计算 连续 整数 的 平方 和 的 公式 (参见 习题 A.2.2). 

虽然 离散 均匀 分 布 的 两 个 最 常见 的 例子 是 抛 措 均 匀 硬 币 和 均匀 山子 , 但 还 有 其 
他 的 例子 ， 我 最 喜欢 它 在 德国 坦克 问题 中 的 应 用 .德国 人 为 坦克 标 上 了 连续 的 编 
号 , 这 个 序列 号 对 他 们 来 说 非常 有 用 . 例如, 可 以 把 1 月 生产 的 零件 都 标记 上 01， 
把 2 月 生产 的 零件 都 标记 上 02, 依 此 类 推 . 那么 , 通过 查看 序列 号 , 人 们 就 能 很 快 
知道 一 个 零件 已 经 使 用 了 多 久 , 以 及 可 能 的 更 换 时 间 . 对 德国 人 来 说 , 这 很 不 幸 ; 但 
对 盟 军 来 说 , 却 非常 幸运 . 通过 察看 被 摧毁 坦克 的 序列 号 , 盟 军 能 够 准确 地 估算 出 
他 们 在 战场 上 可 能 面 对 的 坦克 数量 ! 

德国 坦克 问题 : 在 第 二 次 世界 大 战 中 , 西方 盟 军 试图 统计 德国 人 制造 的 装甲 坦 
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克 数 量 . 为 此 , 他 们 收集 了 被 摧毁 的 坦克 序列 号 , 分 析 了 坦克 的 轮子 , 并 估算 了 当时 
在 使 用 多 少 种 车 轮 模具 . 利用 这 些 信息 , 盟 军 预言 在 “登陆 日 之 前 大 约 有 270 辆 
装甲 坦克 被 生产 出 来 . 事实 上 , 德国 一 共 制 造 了 276 辆 坦克 . 对 于 这 种 令 人 难以 置 
信 的 准确 度 以 及 相当 有 价值 的 估算 , 下 面 就 来 描述 其 背后 的 数学 理论 . 

这 种 分 析 方法 预测 了 无 放 回 抽样 的 离散 均匀 分 布 的 最 大 值 . 由 于 在 第 二 次 世界 
大 战 中 的 应 用 , 它 现在 被 俗称 为 “德国 坦克 问题 ” 我 们 讨论 一 个 更 简单 的 问题 : 序 
列 号 的 范围 是 从 1 到 N, 而 我 们 想 求 出 N. 在 实际 问题 中 , 因为 我 们 不 知道 最 小 的 
数 是 多 少 , 所 以 会 稍微 难 一 些 , 我 把 这 个 问题 留 作 习题 12.8.31. 

首先 给 出 一 些 符号 . 用 N 表示 制造 出 的 坦克 总 数 , 那么 N 就 是 最 大 的 序列 号 ， 
1 是 最 小 的 序列 号 . 假设 我 们 记录 了 个 序列 号 , 其 中 m 是 观察 到 的 最 大 序列 号 . 
我 们 的 目标 是 : 当 已 知 m 和 大 的 值 时 , 试 着 求 出 未 知 的 N， 显 然 , 我 们 估算 的 N 
必须 至 少 和 m 一 样 大 , 并 且 几 乎 可 以 肯定 会 更 大 . 难点 在 于 , 我 们 的 最 优 估计 要 大 
多 少 ? 解决 这 个 问题 的 方法 有 很 多 种 . 在 下 面 的 方法 中 , 我 们 用 N 来 表示 M 的 期 
望 值 (从 {1,2,… , N} 中 无 放 回 地 取出 个 观测 值 , 随机 变量 M 表示 这 个 值 中 
的 最 大 值 ), 然后 反 过 来 利用 观察 到 的 m 估算 N. 
因此 , 我 们 想 求 出 Pr(M = m). 注意 , 这 实际 上 是 一 个 条 件 概率 , 因为 它 依赖 于 
k 和 NN, 但 为 了 简化 符号 , 我 们 将 在 讨论 中 国定 这 些 量 . 首先 , 注意 到 从 {1,… , NN} 
中 选 出 个 不 同 的 数 有 (XY) 种 方法 . 接 下 来 , 最 大 值 为 m 的 元 组 共有 (了) 种 . 
为 什么 ? 我 们 要 从 N 个 数 中 选 出 大 个 , 现在 必须 选择 m, 而 且 不 能 选择 比 m 大 的 
数 . 这 意味 着 我 们 必须 从 {1, 2 …… ,m 一 1} 中 选 出 一 1 个 不 同 的 数 . 于 是 , 当 有 N 
辆 坦克 时 , 我 们 就 证 明了 


Pr(M = m) = (oy 和 > 人 = 1. (12.7) 


最 后 这 个 和 式 将 非常 重要 . 它 之 所 以 成 立 是 因为 这 是 一 个 概率 分 布 , 并 且 m 的 取 值 
范围 是 从 kk 到 N. 

现在 计算 M 的 期 望 值 , 这 个 随机 变量 表示 观察 到 的 坦克 的 最 大 序列 号 (注意 
MM 必须 至 少 和 一 样 大 ). 我 们 有 


N 


N 
IM] = YmPr(M = m) = 》 mm 


N 
m=k m=k 
四 


本 (m—— 1)! 
Dm 
”全 NI 

RN 二 有 | 
ml 
全 — 1)l(m— k)! 
EE 
”= 


现在 面临 的 挑战 是 简化 上 面 的 和 . 在 式 (12.7) 中 写 出 M 等 于 m 的 概率 公式 
时 , 要 记 住 这 里 强调 的 是 概率 和 等 于 1 对 概率 分 布 而 言 , 这 始终 是 成 立 的 . 另外 
我 们 可 以 利用 这 一 点 来 计算 上 面 E[M] 的 和 ! 这 是 因为 得 到 的 结果 很 像 一 个 概率 
和 , 而 这 个 概率 就 是 在 已 有 的 大 + 1 个 观测 值 中 最 大 序列 号 为 m +1 的 概率 . 现在 
我 们 以 一 种 巧妙 的 方式 来 乘 以 1 (我 最 喜欢 的 技巧 之 一 ), 然后 利用 标准 化 常数 理论 
来 说 明 上 述 和 的 一 部 分 等 于 1. 如 果 你 之 前 没有 见 过 这 样 的 计算 方法 , 可 能 会 感到 
困惑 。 人 们 通常 会 在 逐 字 逐 句 的 阅读 中 忽略 全 局 . 为 了 让 你 弄 清楚 发 生 了 什么 , 我 
们 给 出 了 更 多 的 步 又 , 目的 是 突出 其 思想 和 技巧 , 以 便 你 将 来 可 以 进行 类 似 的 论证 . 
我 们 的 目标 是 把 上 述 和 改写 成 下 列 概率 的 和 : 从 N + 1 个 结果 中 取出 +1 个 样 
本 , 这 +1 个 样本 的 最 大 观测 值 是 w 的 概率 . 为 什么 要 这 样 做 ? 在 M 期 望 值 的 公 
式 中 出 现 了 m 乘 以 ("!)， 这 表明 了 要 让 这 两 个 因子 以 巧妙 的 方式 相 乘 , 然后 令 
结果 乘 以 (") = (2 而 (四 = (W171) 就 与 我 们 提 到 的 概率 密度 函数 有 关 . 
现在 进行 代数 运算 . 我 们 有 
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N+1 
k k+l1—1 

= (N+1) >， 
k+l es | 
k+l 

k 
一 一 (N 1 .1 
pt 各 


最 后 一 项 描述 的 是 下 列 概率 的 和 : 当 从 N 十 1 辆 坦克 中 取出 十 1 个 样本 时 , 最 大 
序列 号 为 u 的 概率 ! 我 们 有 必要 认真 思考 一 下 最 后 一 部 分 一 一 因为 概率 密度 函数 


的 和 始终 为 1, 所 以 这 种 做 法 能 让 我 们 避免 计算 一 些 困难 的 组 合 和 1 
于 是 ， 


由 此 可 得 


因为 m zk, 所 以 我 们 的 估计 至 少 与 m 一 样 大 . 对 于 较 大 的 m, 我 
让 m 乘 上 因子 针 ! 来 得 到 N 的 . 毫 不 奇怪 , k 越 大 ， 

这 种 做 法 的 效果 如 何 ? 表 12-1 (来 
了 它 比 传统 估计 要 好 得 多 . 


过 


门 实际 上 是 通 
因子 地 :1 就 越 小 . 
自 维基 百科 的 “德国 坦克 问题 ” 页面) 说明 


表 12-1 我 们 的 统计 估计 与 传统 估计 的 比较 
月 份 统计 估计 情报 判断 德国 记录 
1940 年 6 169 1000 122 
1941 年 6 244 1550 271 
1942 年 8 327 1550 342 
这 为 什么 是 我 最 喜欢 的 问题 之 一 应 该 很 清楚 了 . 它 具 有 令 人 难以 置信 的 现实 


世界 意义 , 而 且 还 涉及 很 多 伟大 的 数学 理论 和 技巧 . 
它 也 能 帮助 你 对 许多 概念 做 一 个 很 好 的 回顾 . 

关于 这 个 问题 , 我 们 还 有 很 多 事情 可 以 做 . 例如 , 可 以 求 置信 区 间 . 换 名 话说， 
在 给 定 m 入 的 前 提 下 , 给 出 入 的 一 个 范围 , 使 得 真实 值 属于 该 范围 的 概率 为 
95%. 所 以 , 现在 只 不 过 是 这 个 神奇 故事 的 开始 , 我 鼓励 你 继续 读 下 去 . 


因此 , 即使 你 不 关心 这 个 问题 ， 


加 | 


二 
EE 


后 
[me 


12.8 习 题 
习题 12.8.1 ”以 下 哪些 分 布 具有 对 称 性 : 泊 松 分 布 、 几 何 分 布 、 离 散 均匀 分 布 、 二 项 分 布 、 负 
二 项 分 布 和 伯 努 利 分 布 ? 使 其 对 称 的 参数 是 什么 ? 


习题 12.8.2 


设 X 和 了 是 相互 独立 的 随机 变量 , 它们 分 别 服从 参数 为 (rx,p) 和 (ry,p) 的 


负 二 项 分 布 , 请 计算 Prob(X 十 Y = n). 


习题 12.8.3 


对 于 一 个 服从 离散 均匀 分 布 的 随机 变量 ， 


有 正 的 概率 . 求 出 该 随机 变量 的 CDF. 


习题 12.8.4 
习题 12.8.5 
习题 12.8.6 


设 一 个 随机 变量 
设 随 机 变量 X 月 


有 从 参数 为 p 的 几何 分 布 , 求 出 E[1/X]. 


[本 


习题 12.8.7 “考虑 


它 在 集合 {1,2, 3,… ,n} 中 取 值 时 


选择 石头 、 


服从 参数 为 p 的 几何 分 布 , 请 给 出 它 的 CDF. 


想象 一 下 , 抛掷 一 枚 均匀 的 硬币 100 次 . 假设 首次 掷 出 正面 是 发 生 在 第 ”次 抛 
掷 , 并 设 一 共 出 现 了 mm 次 正面 . 那么 , 我 们 预计 m 十 n 大 概 等 于 多 少 ? 真实 的 其 
高 于 、 等 于 还 是 低 于 这 个 值 ? 


“石头 剪刀 布 ” 的 游戏 , 每 个 玩家 都 独立 


选择 出 现 的 概率 都 是 1/3. 你 需要 知道 的 是 , 如 果 


会 继续 下 去 ; 否则 游戏 结束 , 并 且 会 有 一 个 顾家 . 


习题 12.8.8 


参数 为 mw， 


在 不 使 
p 的 负 二 项 分 布 . 你 可 以 假设 


负 二 项 分 布 . 
想象 一 下 , 我 们 从 0 开始 随机 游 走 , 并 以 概率 p 向 右 移 动 1. 预计 需要 移动 多 
少 次 才能 到 达 10? 如 果 是 到 达 100 呢 ? 


习题 12.8.9 


习题 12.8.10 


重复 上 一 道 题 , 但 现在 要 求 当 


成 通过 10). 


习题 12.8.11 
后 返回 0 
习题 12.8.12 


大 时 , 我 们 最 终 


如 果 我 们 向 上 移动 的 概率 是 p, 向 
的 概率 是 多 少 ? (提示 : 分 别 考虑 n 
证 明 : 在 上 一 题 描述 的 随机 游 走 中 


题 品 


将 以 概率 1 穿 过 原点 (事实 上 , 我 


7 


到 个 玩家 做 出 了 相同 的 选择 ,为 
我 们 预计 这 个 游戏 要 进行 儿 个 下 
] 卷 积 的 情况 下 , 证 明 : 把 ”个 参数 为 p 的 几何 分 布 相 加 就 得 到 了 一 个 
个 负 二 项 分 布 之 和 是 一 个 参数 为 nl + n2,p 的 


门 会 任意 多 次 穿 过 原点 ). 


| 望 值 会 
剪刀 或 布 , 并 且 每 种 
PF 么 游戏 


合 ? 


第 i 次 移动 时 , 我 们 向 上 移动 i (把 到 达 10 蔡 换 


下 移动 的 概率 是 1 一 p, 那么 在 移动 了 n 步 


是 奇数 和 n 是 偶数 的 情况 .) 
要 p 不 等 于 0 和 1, 当 步 数 增加 到 无 穷 


习题 12.8.13 ”为 什么 不 能 用 几何 分 布 模拟 从 一 副 牌 中 抽 到 一 张 A 所 需 的 等 待 时 间 ? 

习题 12.8.14 ”假设 一 副 牌 共有 1000 张 , 并 且 每 种 花色 的 牌 都 被 编号 为 1 到 250. 首次 取 到 
一 张 2 时 已 经 抽出 的 总 牌 数 能 否 用 几何 分 布 来 很 好 地 模拟 ? 如 果 考 察 的 是 首次 取 到 一 张 
红色 牌 时 已 经 抽出 的 总 牌 数 呢 ? 

习题 12.8.15 ” 设 X 是 一 个 随机 变量 , 它 服 从 参数 为 p 的 几何 分 布 . 考虑 另 一 个 随机 变量 了 ， 
它 服从 参数 为 的 几何 分 布 . 对 于 给 定 的 p, 2 取 何 值 时 ,P(X = 了) 能 取 到 最 大 值 ? 

习题 12.8.16 ”给 出 5 个 独立 且 同 分 布 的 随机 变量 , 它们 取 3 时 的 概率 均 为 p, 取 5 时 的 概 
率 均 为 1 一 p. 求 这 5 个 随机 变量 之 和 的 概率 分 布 . 


习题 12.8.17 


习题 12.8.18 


习题 12.8.19 


设 X 是 一 个 服从 几何 分 布 的 随机 变量 . 


至 


Prob(X >Zz 十 a 


证 


明 : 


给 出 5 个 独立 且 同 分 布 的 随机 变量 , 它们 服从 在 {1,2,3} 中 取 值 
求 这 5 个 随机 变量 之 和 的 概率 分 布 . 
想象 一 下 , 你 是 一 个 新 成 立体 育 联盟 的 委员 , 正 试 


该 设 


几 场 比赛 . 在 每 场 比赛 中 , 4 队 获胜 的 概率 是 p, B 队 获 有 


X>a)= Prob(X > 7). 


的 均匀 分 布 . 
图 决定 在 最 后 的 系列 赛 中 应 


的 概率 是 gq. 假设 p > 9， 


p 十 g 二 1, 并且 每 场 比 赛 的 结果 都 独立 于 之 前 的 比赛 . 该 系列 赛 必须 有 奇数 场 比赛 . 在 一 
n 场 比赛 的 系列 赛 中 , 第 一 个 赢得 哇 :! 场 比 赛 的 队伍 获得 该 系列 赛 的 冠军 . 给 


个 包含 了 


12.8 习 题 
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出 一 个 不 等 式 , 使 其 能 够 解决 下 列 问题 : 这 个 系列 赛 必须 设 


概率 较 高 的 队伍 胜出 的 概率 至 少 为 90%. 
习题 12.8.20 ”考虑 一 列 服从 二 项 分 布 的 随机 变量 
的 概率 是 1 一 pa, 一 共有 nn 个 结果 , 并 且 当 n 


固定 的 有, 当 nn 一 00 时 , X 


A 
伟 


EX 对 Xn 来 说 , 成 功 的 概率 是 mw， 


多 少 场 比赛 , 才能 使 得 获胜 


失败 


co 时 有 pn 一 入. 证 明 : 对 于 任意 一 个 


二 上 的 概率 与 参数 为 和 的 泊 松 分 布 相似 . 
题 12.8.21 ”假设 我 们 不 断 地 抛掷 一 枚 均匀 的 硬币 , 直到 出 现 反面 为 止 . 每 当 掷 出 一 个 


时 , 如 果 这 是 第 i 个 正面 , 就 把 它 指定 为 i. 那么 这 些 值 的 总 和 预计 是 多 少 ? 


正面 


习题 12.8.22 ”对 于 参数 为 p 的 几何 分 布 , 求 出 三 阶 矩 和 三 阶 中 心 距 . 

习题 12.8.23 ”对 于 参数 为 和 的 泊 松 分 布 , 求 出 三 阶 中 心 距 ( 即 偏 斜 度 ). 

习题 12.8.24 ”对 于 参数 为 p 的 几何 分 布 , 计算 它 的 中 位 数 . 

习题 12.8.25 ”Sam 正 忙于 一 位 政治 家 的 竞选 活动 . 众所周知 , 支持 这 位 政治 家 的 人 的 真实 
比例 是 52%, 而 支持 她 对 手 的 人 的 真实 比例 是 48%. 然而 , 无 论 投票 人 选 哪个 候选 人 , 选 
民 


习题 12.8.26 对 于 参数 为 n 和 的 二 项 分 布 , 当 n = 10 有 p= 0.2, 0.4, 0.6, 0.8 时 ， 


习题 12.8.27 ”考虑 一 家 有 5 条 水 平 过 道 和 2 条 


其 累积 密度 函数 的 图 形 (可 能 要 多 画 几 次 才能 得 到 容易 读 懂 的 图 ). 


垂直 过 道 的 杂货 店 . 


[4 


5 4 
10 9 四 
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想象 一 下 , 你 和 朋友 走 散 了 , 你 们 都 不 知道 对 方 在 哪里 . 你 在 1 号 位 置 . 每 走 一 步 ， 


是 随 必 


地 选择 一 个 相 邻 的 顶点 , 并 且 每 个 相 邻 顶点 被 选中 的 概率 都 是 相等 的 . 例如 , 如 果 


投票 率 只 有 50%. 这 个 地 区 共有 3000 人 . 估算 一 下 Sam 支持 的 候选 人 能 够 获胜 的 概 


绘制 


你 都 


你 位 于 9 号 顶点 的 位 置 , 那么 移动 到 10 号 顶点 的 概率 是 1/3, 到 8 号 顶点 的 概率 是 1/3， 
到 4 号 顶点 的 概率 也 是 1/3. 平均 来 看 , 你 要 
置 ) 需要 移动 几 步 ? 例如 , 如 果 你 位 于 9 号 顶点 的 位 置 , 那么 移动 到 10 号 项 点 的 概率 是 


1/3, 到 8 号 顶点 的 概率 是 1/3, 到 4 号 顶点 的 概率 是 1/2. 利 ) 
模型 . 


到 达 10 号 顶点 的 位 置 ( 即 你 朋友 所 在 的 位 


习题 12.8.28 ”重复 上 面 的 习题 , 但 这 次 假设 你 和 


有 可 能 的 移动 方案 中 随机 选取 . 


模拟 来 建立 这 种 情况 的 


你 的 朋友 轮流 移动 , 并 且 每 次 移动 都 是 从 所 


习题 12.8.29 ”候选 人 4 预计 将 获得 65% 的 选票 , 候选 人 B 预计 将 获得 20% 的 选票 ， 
人 C 预计 将 获得 10% 的 选票 , 候选 人 D 预计 将 获得 5% 的 选票 . 如 果 样 本 容量 是 100， 
那么 4 获得 50 票 、B 获得 30 票 、C 获得 1 


习题 12.8.30 ”编写 一 个 程序 , 随机 地 选择 一 个 整数 NN, 然后 从 {1; 2,……… , N} 中 无 放 臣 


5 票 且 D 获得 5 票 的 概率 是 多 少 ? 


出 大 个 元 素 . 比较 德国 坦克 问题 中 估算 的 N， 


习题 12.8.31 


口 


即 鱼 tm 一 1. 


候选 


地 取 


考虑 更 一 般 的 德国 坦克 问题 ， 此 时 的 序列 号 要 从 {Nmin, Nmin 十 1， eo Vl} 
Pp 选 取 . 如 果 观 察 到 的 最 大 序列 号 是 Mmax, 最 小 序列 号 是 Mmin, 那么 AR ey 


. 县 
min 和 候 
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多 少 ? (注意 : 你 打算 直接 估算 Nmax 和 Nain, 还 是 估算 两 者 的 差 ? 这 有 区 别 吗 ? 我 们 最 


终 只 关心 它们 的 差 , 但 或 询 
题 更 容易 解决 .) 


F 和 拉 格 朗 日 乘 数 以 及 参数 和 类 似 , 有 时 候 多 一 些 计 算 会 使 问 
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现在 我 们 使 用 第 9 章 到 第 11 章 中 的 工具 来 研究 不 同 的 连续 型 随机 变量 . 我 们 
将 看 到 , 很 多 乍 看 起 来 完全 不 同 的 随机 变量 可 以 被 认为 是 “同一 类 ”. 这 意味 着 可 
以 选择 其 中 一 些 参数 的 值 , 而 不 同 的 选择 将 给 出 不 同 的 随机 变量 , 但 它们 通常 具有 
相似 的 性 质 . 我 们 已 经 看 到 了 有 一 个 自由 参数 是 多 么 有 用 (参见 第 11 章 以 及 微分 
恒等式 法 ). 

本 章 将 讨论 两 个 最 重要 的 分 布 , 即 均匀 分 布 和 指数 分 布 . 我 们 将 说 明 如 何 计算 
这 些 随 机 变量 的 年 (特别 是 均值 和 方差 ) 以 及 它们 的 和 , 最 后 会 讨论 如 何 利用 这 些 
分 布 来 生成 随机 数 


13.1 均匀 分 布 


现在 是 时 候 看 一 些 具体 的 分 布 了 ! 虽然 不 同 的 教材 经 常 以 不 同 的 顺序 列 出 “ 篆 
见 的 ” 连续 型 随机 变量 (事实 上 , 关于 应 该 或 者 不 应 该 给 出 哪个 概率 密度 函数 ,其 
至 会 有 轻微 的 分 疏 ), 但 大 多 数 都 是 从 研究 均匀 分 布 开始 的 . 从 某 种 意义 上 说 , 它 是 
最 简单 也 是 最 自然 的 . 它 就 是 对 抛 撕 一 枚 均匀 人 硬币 或 者 抛 撕 一 颗 均 匀 山 子 的 连续 


型 类 比 . 


均匀 分 布 : 如 果 随 机 变量 X 满足 


那么 我 们 说 X 服从 区 间 [w 中 (其 中 -oo < a < < co) 上 的 均匀 分 布 , 并 记 作 
X ~ Unif(a,b). 


我 们 要 证 明 均 匀 分 布 的 许多 性 质 . 当然 , 均匀 分 布 有 无 限 多 个 . 幸运 的 是 , 在 许 
多 性 质 中 , 我 们 很 容易 找到 a 和 的 依赖 关系 , 因此 可 以 同时 研究 “所 有 ”均匀 分 
布 . 或 者 说 , 我 们 可 以 将 随机 变量 标准 化 : 如 果 和 ~ Unif(a, 并 且 UV ~ Unif(0,1)， 
那么 X= (5 一 a)U 二 a. 这 意味 着 , 当知 道 服 从 [0,1] 上 均匀 分 布 的 随机 变量 时 , 我 
们 可 以 据 此 得 出 任何 一 个 服从 均匀 分 布 的 随机 变量 . 
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13.1.1 ”均值 和 方差 
手 当 遇 到 一 个 分 布 时 , 首先 要 确定 的 就 是 它 的 均值 和 方差 , 我 们 来 看 一 下 吧 ! 


每 
设 针 ~ Unif(a,b). 那么 X 的 均值 jx 和 方差 o 分 别 是 


_ b+a » (一 ao? 
人 


当 [ao 外 = [0,1] 时 , 均值 为 1/2 且 方 差 为 1/12; 但 如 果 [a,08] = [一 1/2,1/2], 那么 
均值 为 0 且 方 差 为 1/12. 另外 一 种 重要 情形 是 fw 中 = [V3, V3], 此 时 的 均值 为 
0, 方差 为 1. 


直接 求 积分 就 能 给 出 证 明 . 对 于 任意 的 a 和 b, 我 们 采用 同一 种 做 法 , 这 样 就 
同时 处 理 了 所 有 的 均匀 分 布 . 如 果 你 有 特别 喜欢 的 数 , 那 就 用 你 喜欢 的 值 和 " 值 
来 模仿 这 里 的 论证 . 我 们 已 经 给 出 了 三 组 最 重要 的 取 值 . 

均值 为 


现在 来 计算 方差 有 两 种 常用 的 方法 : 计算 EI(X 1x)] 或 者 计算 E[X3] - 
[XJ?. 这 两 种 方法 在 计算 方面 非常 相似 , 均 引入 了 标准 微 积分 . 我 们 来 考察 第 一 种 
方法 . 当 需 要 通过 一 些 代数 运 算 来 得 到 漂亮 的 计算 结果 时 , 我 们 会 把 yx 的 值 放 到 
最 后 代入 . 于 是 有 
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b 
_ 1 (zr-px) 
~ ba 3 


1 CC-px) (a px) 
~ ba 3 上 
此 时 , 如 果 不 知道 wx = (5 十 a)/2, 就 无 法 继续 计算 下 去 . 由 jx = (5 十 a)/2 可 以 推 
出 5 一 jx = (0 一 q)/2 和 a 一 jx = 一 (0 一 Q)/2. 现在 , 我 们 必须 卷 起 袖子 去 做 一 些 代 
数 运算 (在 21 世纪 , 也 可 能 有 一 些 计 算 机 程序 能 帮 我 们 做 这 些 代 数 运 算 ). 现在 有 


人 二 (5 ( | 
b 


接 下 来 只 需要 将 这 些 特殊 值 代入 公式 即 可 . 最 后 一 种 特殊 情形 [a,0b] = [V3,V3| 给 
出 了 一 个 均值 为 0 有 方差 为 1 的 均匀 分 布 . 在 很 多 应 用 中 , 我 们 希望 把 变量 标准 化 
为 均值 为 0 日 方差 为 1 的 变量 , 所 以 这 种 情况 在 将 来 会 很 有 用 . 
现在 巴 甫 洛 夫 反 射出 现 了 : 我 们 得 到 了 一 个 答案 , 它 合理 吗 ? 均值 很 容易 验证 . 
均值 介 于 a 和 5 之 间 , 这 是 有 道理 的 . 此 外 , 如 果 让 a 和 2 翻 倍 , 那么 均值 也 会 翻 
倍 , 这 恰好 与 我 们 的 预测 一 致 . 
方差 该 如 何 验证 昵 ? 从 最 后 一 个 公式 中 可 以 推出 很 多 好 的 结论 . 第 一 点 是 , 方 
差 只 与 5 和 a 的 差 有 关 . 经 过 片刻 思考 后 , 我 们 应 该 能 够 预测 到 这 一 点 . 如 果 让 a 
和 5 都 加 上 100, 那么 均值 就 改变 了 , 但 变量 在 均值 附近 的 波动 水 平 却 不 会 发 生变 
化 . 接 下 来 , 我 们 观察 到 方差 与 - a 的 平方 有 关 . 由 此 可 以 推出 两 个 很 好 的 结论 : 
首先 , 它 确保 方差 是 非 负 的 ; 其 次 , 方差 具有 正确 的 单位 (如 果 a 和 5 的 单位 是 米 ， 
那么 方差 的 单位 就 是 平方 米 , 因此 标准 差 的 单位 是 米 ). 最 后 , 标准 差 ( 即 方差 的 平 
方 根 ) 等 于 (5 一 a)/V12. 注意 , 这 个 值 小 于 5 一 a. 因为 两 个 值 的 最 远 距 离 就 是 5 一 a， 
所 以 标准 差 应 该 小 于 5 一 a. 再 次 重申 , 如 果 可 以 通过 简单 的 验证 来 确保 答案 的 合 
理性 , 那么 你 有 必要 去 这 样 做 . 除了 检查 错误 之 外 , 这 样 做 还 有 助 于 你 建立 解 题 的 
直觉 . 
13.1.2 ”服从 均匀 分 布 的 随机 变量 之 和 


关于 服从 均匀 分 布 的 随机 变量 , 我 们 还 有 一 个 问题 要 回答 : 服从 均匀 分 布 的 随 
机 变量 之 和 会 服从 什么 样 的 分 布 呢 ? 为 了 简单 起 见 , 不 妨 设 X 和 YY 都 服从 [0,1] 上 
的 均匀 分 布 . 如 果 我 们 能 处 理 这 种 情况 , 那么 就 可 以 将 其 推广 到 一 般 的 均匀 分 布 上 . 
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设 X 和 了 是 相互 独立 的 随机 变量 ， 


访 右 0<z<l 
fz(2)= $4 2—z 若 1<z<2 
0 其 他 . 


并 且 都 服从 Unif(0,1), 那么 Z=X+TY 的 


和 


证 


35 1 
fz(2) = ff(z—t)dt, fl(u) 让 


我 们 现在 就 来 计算 这 个 积分 . 
0 < z<<2 和 >z>2. 为 什么 是 这 三 个 区 间 呢 ? 我 们 


匀 分 布 . 因此 , 只 有 当 


三 个 区 间 上 考虑 是 很 


0 


的 随机 变量 要 服从 


用 卷 积 理论 ( 见 第 10 章 ) 可 以 得 出 上 述 答案 , 即 


(13.1) 


不 难 想到 ,，z 的 取 值 范围 要 分 成 三 种 情况 : z < 0， 


0,1] 上 的 均 


z E [0,2] 时 , 概率 密度 函数 才 不 为 0, 所 以 把 计算 分 别 放 在 这 


自然 的 . 我 们 将 证 明 z < 0 时 的 概率 为 0, 类 似 的 方法 可 以 证 


明 当 > > 2 时 概率 也 为 0. 在 给 出 这 个 证 明 后 , 就 剩 下 了 最 难 的 部 分 , 旭 0< z<2 


时 概率 . 


假设 z < 0. 式 (13.1) 中 


的 被 积 函 数 是 f(t)f(z 一 ). 为 了 保证 被 积 函 数 不 为 0， 


我 们 有 0<t<1l 和 0<z-t<1, 而 后 者 与 2 一 1<t<z 是 一 样 的 . 如 果 > < 0， 


那么 第 二 个 条 件 将 迫 


使 :< 0， 


被 积 函数 始终 为 0, 所 以 概率 也 为 0. 


现在 只 需要 考察 0 < z < 2 时 的 情形 .与 之 前 一 样 ， 
z 一 1 tz 时, 被 积 函 数 才 不 为 0. 当 0<z<2 时 , 对 于 每 个 z, 总 有 一 些 t 会 使 


得 两 个 条 件 同时 得 到 
情 就 会 变 得 相当 简单 


0 过 t 过 1. 当 


界 是 非 平凡 的 ， 


0 过 zz 过 1 时 ， 


因此 第 一 个 条 件 就 无 法 满足 了 . 于 是 , 当 > < 0 时 ， 


只 有 当 0 冬 圭 乞 工 且 


满足 . 不 要 烦躁 , 如 果 把 这 种 情形 分 成 若干 子 情形 来 讨论 , 事 


! 哦 , 情形 的 子 情形 ! 真 


我 们 只 考虑 0 < 


你 自己 完成 . (但 是 , 在 分 析 结 束 后 , 我 们 会 简 


出 另 一 个 子 情 形 .) 


总 之 , 现在 只 需要 考虑 0 < z < 1 的 子 必 
和 zz 一 1<t<z 的 t 积分. 第 一 个 条 伯 


于 两 个 条 件 必须 同时 满足 , 因此 使 得 被 积 函 数 (f(z 一 丰 不 为 0 的 t 


t € [0, 2]. 


J 有 这 个 必要 吗 ? 很 遗憾 , 是 的 ! 虽然 
第 一 个 条 件 很 好 , 但 是 第 二 个 条 件 与 z 有 关 . 我 们 知道 必须 满足 第 一 个 条 件 , 所 以 
因为 z 一 1 < 0, 所 以 z 一 1<t 一 定 成 立 . 此 时 ,t 的 上 
因为 它 会 让 t < z. 如果 z > 1 那么 上 界 4 < > 一 定 会 成 立 . 但 下 界 
z 一 1 <t 就 是 非 平 凡 的 . 于 是 , 我 们 轻松 地 把 问题 分 成 了 几 种 情况 来 考虑 


地 说 


z < 1 的 情形 . 另 一 种 情形 可 以 按照 类 似 的 方法 来 分 析 , 留 给 
说 如 何 从 这 个 子 情形 立即 推 


4 形 . 我 们 要 对 所 有 同时 满足 0<t<1 
F 要 求 t+ € [0,1 


, 但 第 二 个 条 件 进 


步 要 求 
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只 能 取 值 te [0,z]. 于 是 ， 


fz)= {11dt= 


正如 前 面 所 承诺 的 , 我 们 简单 地 说 一 下 , 在 不 求 积 分 的 前 提 下 , 如 何 快速 求 出 
z 之 1 时 的 答案 2 - >. 关键 是 要 注意 到 , 铸 =1 一 和 Y=1 一 Y 的 概率 密度 函数 
与 X 和 YY 的 一 样 ! 这 是 因为 我 们 的 概率 密度 函数 关于 1/2 对 称 . 这 一 点 有 什么 用 
昵 ? 铸 和 六 均 服从 Unif(0,1), 并 且 当 针 +Y€ [0,1] 时, X+Y=2-(X+Y) e [1,2]. 
上 面 的 论述 表明 了 关 十 站 = we [0,1] 的 概率 就 是 wu. 当 z € [1,2] 时 , 如 果 把 w 写 
4 一 2 一 2 那么 会 看 到 和 十 工 = 2 的 概率 就 是 2 一 z! 这 种 对 称 论证 非常 强大 ， 
通常 能 节省 大 量 烦 琐 重 复 计 算 的 时 间 . 
我 们 在 图 13-1 中 绘制 了 X 十 Y 的 概率 密度 函数 (X 和 YY 是 相互 独立 的 随机 
变量 , 且 均 服从 Unif(0,1)). 


Da bd 


0.5 1.0 1.5 2.0 


图 13-1 关 +Y 的 概率 密度 函数 图 , 其 中 X 和 YY 是 相互 独立 的 随机 变量 , 且 均 服从 Unif(0, 1) 


注意 , 结果 是 一 个 漂亮 的 三 角形 函数 ! 如 果 回顾 一 下 抛 搓 两 颗 均 匀 仍 子 得 到 的 
数字 和 , 那么 这 个 结果 应 该 不 会 令 人 感到 惊讶 ， 在 掷 般 子 的 问题 中 , 我 们 得 到 了 一 
个 三 角形 函数 ,“ 数 字 和 为 7” 这 一 中 间 事 件 发 生 的 概率 是 6/36, 从 这 一 点 开始 , 概 
率 会 线性 递减 到 两 种 极端 情形 , 即 “ 数 字 和 是 2” 与 “数字 和 是 12”. 这 两 个 事件 发 
生 的 概率 均 为 1/36 (数字 和 为 + 的 概率 是 全 半 , 三 角形 以 7 为 中 心 ). 


如 果 再 次 进行 卷 积 会 怎样 呢 ? 我 们 在 图 13-2 中 给 出 了 答案 , 而 且 给 出 了 8 个 


相互 独立 且 均 服从 Unif(0,1) 的 随机 变量 之 和 的 结果 , 并 将 其 与 相应 的 正 态 分 布 进 
行 比较 . 


362 第 13 章 连续 型 随机 变量 : 均匀 分 布 与 指数 分 布 


JS 


4 


图 13-2 ”Xi 十 … 十 XX 的 概率 密度 函数 图 ， 


变量 : (上 图 )n = 3, (下 图 )n = 8 以 及 具 和 在 


6 


其 中 X; 是 相互 独立 


8 


均 服从 Unif(0, 1) 的 随机 


相同 均值 


[与 方差 的 正 态 分 布 


概率 论 中 最 重要 结果 之 一 是 ,“ 好 ”的 独立 随机 变量 之 和 会 收敛 于 正 态 分 布 . 我 
们 可 以 先 看 一 下 8 个 服从 均匀 分 布 的 随机 变量 的 情况 , 它 与 所 对 应 的 (具有 相同 均 


值 与 方差 的 ) 正 态 分 布 能 够 完美 拟 合 ! 


对 于 任意 多 个 独立 且 服 从 均匀 分 布 的 随机 变量 , 我 们 可 以 明确 写 
概率 密度 函数 , 但 得 到 的 概率 密度 函数 仅 是 分 段 连续 的 , 并 | 


不 同 区 域 的 数量 也 会 增加 . 


13.1.3 ”例子 


它们 的 和 的 


可 
上 二 


昌 随 着 变量 的 不 断 累 加 ， 


现在 来 看 一 下 我 们 能 收获 哪些 好 处 . 如 果 X 和 Y 是 相互 独立 且 均 服从 Unif 
(0,1) 的 随机 变量 , 那么 Z = X 上 +Y 在 1/2 和 3/2 之 间 取 值 的 概率 是 多 少 ? 根据 
前 文 , 我 们 知道 Z 的 概率 密度 函数 : 当 0 < z < 1 时 fz(2) = 名 当 1<z<2 时 


成 两 个 部 分 . 于 是 有 


E 了 改变 , 这 提醒 我 们 要 把 积分 分 解 
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3/2 
Prob(1/2 < Z < 3/2) = fz(2)dz 
1/2 
1 3/2 
一 fz( )daz+ 1/ jz(z)dz 
1/2 1 
3/2 
Sy dot (2— 2z)d 
1/2 1 
3/2 
- 是 (2 一 2 
i 2 
1/2 1 
4 i a 
~ \2 8/ 8 2 4 


再 来 看 一 个 例子 . 假设 对 和 站 是 相互 独立 且 均 服从 Unif(1,3) 的 随机 变量 ， 


我 们 想 求 出 Z = 六 十 Y 属于 [8,5] 的 概率 . 我 们 当然 可 以 模仿 上 面 的 计算 , 但 还 有 


种 更 便捷 的 方法 ! 利用 变量 蔡 换 公式 (参见 10.4 节 ), 这 个 问题 可 以 被 简化 成 刚 


刚 解决 的 问题 , 从 而 证 明了 我 们 花 很 多 时 间 探 讨 变量 替换 公式 的 价 


现在 有 2 = X+ 立 和 雹 = 态 二 六 其 中 和 和 是 相互 独立 


的 随机 变量 , 而 和 YY 是 相互 独立 且 均 服从 Unif(1,3) 的 随机 变量 . 


多 =2X+1 
立 =2Y+1 
Z =2(X+Y)+2 = 22+2. 


值 . 


均 服 从 Unif(0, 1) 


我 们 有 


于 是 , 2 = g(2Z), 其 中 g(z) = 2z 十 2 定义 在 区 间 T= [0,2?] 上 . 注意 


9g(2) = 2 


可 知 , 9 是 严格 增加 的 , 且 其 反 也 数 为 h(2) = (2 一 2)/2. 我 们 是 1 


Zz 二 g(z) = 2z 十 2, 现在 用 z 来 表示 z. 接 下 来 进行 代数 运算 就 能 得 H 


以 轻松 地 求 出 (2), 它 就 是 1/2. 
根据 变量 替换 公式 , 有 


fz(2) = fz(h(2)) :RA(a). 


强 上 


公 做 到 的 ? 已 知 


结果 . 我们 可 


上面 的 因子 是 非常 重要 的 , 我 们 不 只 是 把 它 代 入 到 概率 密度 函数 


时 ( 稍 后 会 对 它 已 


g(0) < Z < g(1), 


做 出 更 多 说 明 ). 由 前 文 可 知 , 如 果 z < 0 或 zz2, 那 么 fz(z)=0; 当 0<z<1l 时 
fz(z) = 5 当 1<z<2 时 fz(z) 一 2 一 x 和 如果 0< h(2) < 1, 那么 
即 2 < z<4; 类 似 地 , 如 果 1<h(2) < 3, 那么 4< 2<6. 于 是 

一 若 2<&Z<4 


生 党 我 们 信 间 地 加 考 “ 下 计算 机 如 何 生 成 “个 朋克 .1 上 元 布 的 风机 
= 
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既然 现在 有 了 概率 密度 函数 , 我 们 就 可 以 通过 直接 积分 求 出 所 需 的 概率 . 
实际 上 , 没 必 要 把 概率 密度 函数 fz 明确 地 写 出 来 , 而 是 可 以 进行 变量 替换 并 
直接 使 用 fz. 于 是 有 


= Prob(1/2 < 2Z < 3/2) 
3/2 
和 fz(2)dz; 


1/2 


然而 , 这 正 是 我 们 在 上 一 个 例子 中 所 做 的 积分 , 因此 答案 就 是 3/4. 

值得 一 提 的 是 链 式 法 则 中 的 因子 hv, 遗漏 它 是 最 常见 的 错误 之 一 . 假设 有 一 个 
函数 4(z) = f(h(z)). 由 链 式 法 则 可 知 4'(x) = (h(x)) :V(xz). 大 多 数 人 都 记得 计 
算 Fr 在 h(x) 处 的 值 (由 于 f 会 在 h(xz) 处 取 值 , 所 以 它 的 导数 也 会 在 该 点 处 取 值 
是 很 合理 的 ). 难点 在 于 记得 (xz). 如 果 h(xz) = 2z, 那么 可 以 想象 成 我 们 正在 以 两 
音 的 速度 行进 , 因此 其 导数 也 应 该 有 因子 2， 如果 这 个 论述 没有 帮助 , 那 就 再 看 
个 . 假设 f(x) = zx” 且 h(x) = zx, 那么 A(x) = zx" 且 4(z) = nz 是 z. 最 后 一 个 
因子 是 1, 虽然 当 pz) = x 时 我 们 看 不 到 它 , 但 它 的 确 在 那里 . 
13.1.4 ”均匀 地 生成 随机 数 

本 章 的 各 部 分 都 有 相同 的 模式 , 但 因为 我 们 现在 只 考察 了 一 种 分 布 , 所 以 这 个 
模式 还 不 是 很 明显 . 我 们 要 做 的 是 , 对 于 每 种 分 布 , 首先 计算 它 的 均值 与 方差 , 然后 
研究 独立 同 分 布 的 随机 变量 之 和 , 再 给 出 一 些 例子 和 应 用 , 最 后 对 如 何 从 该 分 布 中 
产生 随机 变量 进行 简短 的 讨论 . 

本 节 会 比 其 他 小 节 短 , 因为 我 们 会 假设 存在 一 个 随机 数 生成 器 , 它 可 以 提供 一 
个 服从 Unif(0,1) 的 随机 变量 . 在 数学 书 中 , 我 们 经 常 看 到 如 “ 设 X 服从 [0,1] 上 
的 均匀 分 布 ” 的 条 件 , 以 至 于 态 记 了 如 何在 实践 中 真正 做 到 这 一 点 . 事实 证 明 , 如 
果 能 生成 一 个 真正 服从 Unif(0,1) 的 随机 变量 , 那么 就 可 以 利用 变量 蔡 换 公 式 轻 松 
地 生成 很 多 其 他 的 连续 型 随机 变量 . 我 们 会 在 其 他 章节 中 更 详细 地 讨论 这 个 问题 . 
现在 , 我 们 简要 地 讨论 一 下 , 如 何 利 用 [0,1] 上 的 均匀 分 布 来 生成 随机 数 的 问题 . 有 
关 从 各 种 分 布 中 生成 随机 数 的 更 多 信息 , 请 参见 http://www.random.org/, 特别 是 
与 背景 相关 的 内 容 (http://www.random.org/randomness/). 

下 面 是 克 里 斯 韦 策 尔 的 一 个 网 页 的 链接 : http:/ /faculty.rhodes.edu/wetzel/ 
randomyintro.html， 除 了 提供 背景 阅读 外 , 它 还 允许 你 选择 生成 想 要 的 随机 序列 
并 让 电脑 运行 一 些 标准 的 测试 . 


量 . 如 果 有 一 枚 完全 均匀 的 硬币 , 可 以 把 它 抛 括 ”次 . 若 第 宇 次 括 出 的 是 正面 ， 
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就 令 a; = 1; 若 掷 出 的 是 反面 , 则 令 a; = 0. 于 是 , 我 们 得 到 了 下 面 的 数 

Ql 2 

有 
如 果 硬 币 是 均匀 的 , 那么 这 个 过 程 会 从 集合 

1 2 3 2 一 1 

fo 2m， 27， Dn ， on } 

中 均匀 地 生成 一 个 随机 数 . 遗憾 的 是 , 我 们 不 能 令 n 一 co, 因为 结果 是 由 计算 机 运 


行 出 来 的 . 在 有 限时 间 内 , 我 们 只 能 做 有 限 多 步 . 现在 , 就 所 有 实际 目的 而 言 , 当 n 


大 时 , 这 个 离散 集合 与 [0,1] 上 的 均匀 分 布 是 没什么 区 别 
很 难 想 象 我 们 能 够 做 精 而 


那么 2100 000 > 1030 989， 而 


测量 ! 也 就 是 说 , 我 们 无 法 做 到 精确 度 如 此 高 的 测量 , 但 


真正 服从 均匀 分 布 的 随机 变量 


子 . 在 极限 理论 中 , 即使 无 理 数 (在 某 利 


> 间 没 有 任何 区 别 . 数学 和 物理 学 中 有 很 多 这 样 的 


间 也 仍然 存在 着 深刻 的 差别 . 举 一 个 很 有 趣 的 例子 , 从 物理 学 角 


男 一 个 例子 是 , 在 数论 或 凯 历 理 


容 是 , 如 果 a 是 一 个 无 理 数 , 忆 
理 数 (其 实 , 它 是 个 超越 数 ), 但 


意义 上 ) 非 


让 
中 


接近 于 一 个 有 理 数 , 它们 


jh 么 na 模 1 是 等 分 的 ; 刘 维 尔 数 于 >610-" 是 
我 们 很 难 把 它 与 它 的 有 理 近 似 区 分 开 来 
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在 上 节 中 , 我 们 研究 了 服从 均匀 分 布 的 随机 变量 


布 的 随机 变量 


. 这 里 出 现 了 一 些 均匀 分 布 不 具备 的 新 特性 . 


随机 变量 没有 
区 间 内 . 我 们 
的 ) 步骤 是 有 意义 的 . 


紧 文集 . 这 意味 着 不 会 
必须 处 理 无 穷 大 问题 , 而 


8 现 一 个 有 限 


. 现在 把 目光 转向 服从 指数 
最 重要 的 区 别 是 , 这 
区 间 , 迫使 所 有 可 能 性 都 落 在 


且 要 做 更 多 工作 来 证 明 其 中 一 些 (非常 合 


很 


的 . 例如 , 假设 n= 100 000， 
到 30 000 个 数量 级 的 物理 
这 并 不 意味 着 这 个 近似 与 


例 
2 


度 考察 利 萨 如 图 形 . 
论 中 考察 克 罗 内 克 定 理 (参见 例子 [MT-B]). 它 的 内 


无 


分 


上 5 


该 
理 


指数 分 布 : 如 果 随 机 变量 X 满足 


那么 说 X 服从 参数 为 > 0 的 指数 分 布 , 3 
非 标准 的 有些 教材 会 使 用 e->* 和 来 表示 参数 为 入 
的 指数 分 布 . 这 两 个 定义 当然 是 相关 的 , 但 你 应 该 选择 其 中 一 个 定义 并 始终 


注意 ; 很 遗憾 , 这 个 符号 是 


下 去 . 


若 z>0 
其 他 . 


记 作 X ~ Exp( 和 ). 


坚持 


现在 , 我 们 像 讨 论 上 一 节 的 随机 变量 那样 , 遍历 相同 的 步 又 和 结果 . 
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13.2.1 ”均值 和 方差 


设 久 ~ Exp( 和 ). 均值 jx 和 方 兰 oX 分 别 是 


Lx 二 入 和 o% = AX. 


特别 地 , 当 入 = 1 时 , 均值 和 方差 都 等 于 1. 


与 均匀 分 布 类 似 , 证 明 是 通过 求 大 量 积分 而 得 到 的 . 我 们 有 


oo oo 1 
Hx =| ZJjJx(z)dz = ZXe "dr. 
一 co 0 


现在 只 需要 找到 求解 这 个 积分 的 最 佳 方法 就 行 了 . 首先 应 该 注意 到 , 被 积 图 数 与 和 


有 关 是 件 好事 . 如 果 令 t= xz/ 和, 那么 dt = dx/ 和 , 这 样 就 可 以 把 入 从 积分 中 提取 出 


来 , 从 而 有 四 
一 入 te 一 dt. 
HX © 


荆 


这 种 做 法 真正 的 好 处 是 ， 


J] 以 看 到 不 同 指数 分 布 之 间 的 关联 . 积分 与 和 的 相关 性 真 


的 非常 微弱 , 难点 在 于 如 何 计算 上 面 这 个 积分 . 如 果 了 解 伽 马 函数 (参见 第 15 章 )， 


我 们 会 注意 到 这 个 积分 就 是 T(2) = 1, 稍 后 会 讨论 这 种 方法 . 


当然 , 更 普遍 的 方法 是 分 部 积分 , 即 


Ce oo Co 
J, udv = LU 一 下 vdu. 
0 0 0 


令 凡 =t, du 二 dt, dv 二 e-tdt 有 w= 一 e-!, 我 们 得 到 了 


这 个 计算 中 的 某 些 部 分 很 容易 引起 混淆 , 尤其 是 当 你 已 经 进行 微 积 分 计算 时 . 
当然 , 第 一 步 是 确定 使 用 分 部 积分 法 , 在 做 决定 后 就 要 开始 选择 v 和 v. 我 们 会 很 


自然 地 想到 利用 分 部 积分 法 , 原因 在 于 我 们 知道 如 何 对 每 个 


因子 


hE 独 积分 , 并 希望 


利用 分 部 积分 法 来 处 理 它们 的 乘积 . 现在 有 两 种 选择 : 可 以 令 w=t 且 dv = eidt， 
也 可 以 令 久 =e-! 且 dv = tdt. 哪 种 选择 更 好 呢 ? 第 一 种 会 更 好 . 这 是 因为 , 如 果 选 
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择 第 二 种 做 法 , 在 分 部 积分 后 会 得 到 如 . 这 个 方向 是 错误 的 : 我 们 以 指数 函数 与 一 
次 多 项 式 的 乘积 为 开端 , 最 终 却 得 到 了 指数 函数 与 二 次 多 项 式 的 乘积 ! 我 们 希望 多 
项 式 的 次 数 减少 , 而 不 是 增加 , 因此 应 该 令 w=. 

另外 , 还 有 一 部 分 计算 需要 验证 , 即 


Co 
—te-t| = 0. 
0 


有 一 半 的 计算 是 没 问题 的 : 当 t+ = 0 时 , 显然 有 一 0e-° = 0; 但 是 , 该 如 何 理解 
一 co0e-% 了 呢 ? 关键 是 要 想到 利用 洛 必 达 法 则 : 如 果 lim;_,s, f(z)/g(zx) 是 0/0 或 
co/co, 并 且 了 与 9 均 可 微 , 那么 lims_,zo f(z)/g(z) = limz -co f(z)/g (x). (如果 这 
个 极限 仍 是 0/0 或 co/co, 那 就 继续 使 用 洛 必 达 法 则 , 直到 不 再 出 现 这 种 形式 的 极 
限 .) 注意 , zo 可 以 是 个 有 限 数 , 也 可 以 是 无 穷 大 的 . 利用 洛 必 达 法 则 , 有 


lim te 一 = lim 二 三 lim 二 一 0. 
00 t 一 co 8 t 一 co e 
我 们 已 经 证 明了 均值 为 和 , 还 证 明了 
站 te ‘dt=1. (13.2) 
0 


这 个 结果 在 计算 方差 时 非常 重要 , 而 且 有 必要 把 它 单独 列 出 来 . 注意 , 这 里 有 个 很 
好 的 概率 解释 , 即 参数 为 1 的 指数 分 布 的 均值 等 于 1. 
方差 可 以 用 类 似 的 方法 计算 . 我 们 有 


这 里 利用 了 变量 蔡 换 上 = zx/ 和 . 

接 下 来 有 多 种 计算 方法 . 最 直接 的 做 法 就 是 咬 紧 牙关 、 卷 起 袖子 , 准备 好 进行 
两 次 分 部 积分 . 如 果 令 = (t 一 1)? 且 dv = e-tdt, 那么 在 一 次 分 部 积分 后 , 我 们 会 
得 到 一 个 以 te- 为 因子 的 结果 . 根据 均值 的 计算 思路 , 我 们 知道 该 如 何 解 答 . 现在 
来 看 一 下 细节 . 我 们 有 


u= (t-1) 8H dv = edt, 
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因此 
du = 2(t—1)dt 且 v= -et 
| udv = wl =“) vdu, 
所 以 有 


六 le — 1)2(—e-!) + | 2 Derrdl 


ee. 入 2 [ 2 到 一 二 -dl ) 
十 | (t— 1)e 
中 ,由 洛 必 达 法 则 可 知 


遗憾 的 是 , 一 切 还 没有 结束 , 还 有 一 个 积分 要 算 ! 当然 , 一 种 方法 是 再 次 使 用 分 部 积 
分 法 , 令 久 ==t 一 1 且 dv =e-tdt. 现在 还 有 另外 一 种 方法 : 可 以 把 剩 下 的 这 个 积 4 
式 展 开 , 从 而 发 现 它 就 是 (参数 为 1 的 指数 分 布 的 ) 均值 与 概率 密度 函数 积分 的 差 ， 
而 这 个 概率 密度 函数 是 参数 为 1 的 指数 分 布 的 概率 密度 函数 . 式 (13.2) 告诉 我 们 
第 一 个 积分 等 于 1, 而 第 二 个 积分 就 是 1 (因为 概率 密度 函数 在 实数 集 上 的 积分 值 
为 1). 因此 , 最 后 这 个 积分 为 0. 

当然 , 如 果 你 不 喜欢 这 种 方法 , 可 以 再 次 使 用 分 部 积分 法 . 只 要 有 可 能 , 就 尽 
量 把 计算 简化 成 已 经 解决 的 问题 , 因为 这 会 节省 你 在 代数 运算 和 求 积分 上 花费 的 时 
间 ! 

正如 前 面 承诺 的 , 现在 讨论 解决 这 个 问题 的 男 一 种 方法 , 它 涉及 伽 马 函数 工 (s). 
我 们 会 在 第 15 章 展开 详细 讨论 . 现在 , 最 重要 的 是 


当 Re(s) >0 时 ， ”Ts = etts—1dt 
0 


曙 


和 


如 果 是 正 整 数 , 那么 T(n 填 1)=nl. 
利用 这 两 个 事实 , 我 们 可 以 轻松 地 求 出 方差 . 方差 就 是 


全 (t— 1)2e tdt 
0 


一 2 (2 —2t+1)e dt 
0 


一 和 2 I/ ted-2 1/ edt+ 上 ed 
0 0 0 


= XT(3) — 2T(2) +T(1)]. 
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我 们 会 解释 这 三 项 中 的 其 中 一 项 为 什么 是 正确 的 , 并 把 剩 下 的 两 项 留 给 你 自己 考 


虑 : 
由 te-tdt = ett ldt = T(3). 
0 0 


由 伽 马 函数 的 第 二 条 性 质 可 知 


ax = X21 -2.1+01] = 入 2. 


当然 , 我 们 最 终 得 到 了 相同 的 答案 , 但 现在 的 重点 是 背景 知识 . 具体 地 说 , 我 们 正在 
了 解 学 习 伽 马 函 数 的 好 处 . 之 所 以 展示 这 种 方法 是 因为 它 是 这 个 一 般 原理 的 好 例 
子 : 考察 一 般 的 计算 , 然后 通过 具体 化 参数 来 获取 所 需 的 情况 . 这 类 似 于 微分 多 项 
式 . 比如 , 没有 人 去 记忆 或 者 考察 f(x) = 1701z1017 一 24 601z123 + 314z15 一 2718 的 
导数 . 我 们 所 做 的 是 学 习 zx" 的 导数 是 多 少 , 以 及 和 的 导数 就 是 导数 的 和 , 然后 把 这 
些 结论 用 于 f(x), 这 样 就 能 马上 得 出 f(x) 的 导数 . 这 里 的 情况 也 是 类 似 的 一 一 花 
些 时 间 做 关于 伽 马 函 数 的 计算 , 以 后 就 可 以 从 中 获得 好 处 . 


13.2.2 ”服从 指数 分 布 的 随机 变量 之 和 


令 人 惊讶 的 是 , 对 于 ”个 相互 独立 且 均 服从 指数 分 布 的 随机 变量 , 它们 的 和 有 
一 个 漂亮 而 整洁 的 公式 . 不 必 感 到 惊讶 , 它 也 是 “有 名 字 ” 的 分 布 之 一 , 但 并 不 像 入 
门 课 中 的 其 他 概率 密度 函数 那样 有 名 . 这 就 是 所 谓 的 爱 尔 朗 分 布 . 它 最 初出 现在 爱 
尔 朗 的 工作 中 , 用 来 分 析 电 话 的 分 布 , 现在 则 广泛 应 用 于 排队 论 中 . 


爱 尔 朗 分 布 : 设 Xi,… ,Xh 是 n 个 独立 同 分 布 的 随机 变量 , 它们 均 服从 参数 为 
入 > 0 的 指数 分 布 . 那么 六 = Xi 十 … 十 Xn 的 概率 密度 函数 是 


zr-le-7/ 和 若 

et 2 之 
fx(7z) = | A (no— 1)! 

0 其 他 . 


如 果 一 个 随机 变量 的 概率 密度 函数 是 上 面 的 fx, 那么 这 个 随机 变量 就 服从 参数 
为 入 n 的 爱 尔 朗 分 布 , 其 均值 为 nX, 方差 为 nX?. 
警告 ! 与 指数 分 布 的 情况 类 似 , 有 些 教材 会 使 用 1/ 而 不 是 , 因此 在 使 用 任何 
一 本 教材 之 前 , 你 必须 仔细 检查 . 


我 们 来 证 明 n = 2 时 的 公式 . 如 果 想 通过 练习 来 测试 这 部 分 内 容 的 实际 作用 ， 
你 应 该 做 一 下 习题 13.3.22, 并 把 这 里 的 论述 推广 到 一 般 的 n. 知道 答案 是 什么 有 很 
大 的 好 处 , 通常 , 这 可 以 指导 你 如 何 处 理 代 数 运 算 . 在 读 过 下 面 的 计算 之 后 , 你 应 该 
利用 归纳 来 试 着 推导 一 般 情 况 . 
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现在 来 详细 地 讨论 n = 2 时 的 情况 . 我 们 再 次 利用 卷 积 的 积分 来 给 出 两 个 独 
立 随机 变量 之 和 的 概率 密度 函数 . 令 


eT 若 z>0 
= | 0 其 他 . 


表示 标准 指数 分 布 的 概率 密度 函数 . 于 是 X = Xi + X2 的 概率 密度 函数 就 是 


产 四 = 人 a 


此 时 , 回想 一 下 服从 均匀 分 布 的 随机 变量 之 和 , 我 们 得 到 了 一 个 噩梦 般 的 答案 . 你 
可 能 会 很 紧张 , 担心 这 里 会 涌现 出 大 量 代数 运算 . 幸运 的 是 , 实际 情况 要 简单 得 多 ! 
原因 是 , 在 均匀 分 布 的 定义 中 , 函数 形式 在 2 个 点 处 发 生 了 变化 , 而 指数 分 布 只 有 
一 个 这 样 的 点 . 这 意味 着 我 们 要 分 析 的 情况 会 更 少 , 代数 运算 也 不 会 太 复杂 . 
因为 被 积 函数 不 为 0, 所 以 t+>0 且 x 一 t > 0. x <0 的 情况 是 不 可 能 发 生 
的 . 很 好 , 已 经 完成 一 半 了 ! 如 果 x > 0, 那么 上 面 两 个 条 件 组 合 在 一 起 就 得 到 了 
0<t<z, 这 是 个 不 错 的 区 间 . 当 x >0 时 , 有 


荆 


一 > 


zw =/ i 


化 
| ete— (®t) dt 
0 
化 
Ss/ e ‘e— ?etdt 
0 
= 人 dt = Ze *. 
0 


与 均匀 分 布 的 情况 不 同 , 可 以 用 一 个 漂亮 的 显 式 公式 来 表示 n 个 独立 同 分 布 
的 随机 变量 的 卷 积 . 因此 , 我 们 自然 会 问 , 当 n 一 oo 时 答案 是 什么 . 本 书 之 后 (第 
20 章 ) 将 证 明 中 心 极限 定理 , 它 表明 了 当 n 一 oo 时 , 这 些 和 会 服从 正 态 分 布 ( 想 了 


解 更 多 关于 正 态 分 布 的 内 容 , 请 参阅 第 14 章 ). 对 于 均值 为 ux 且 方 差 为 o& 的 正 
态 分 布 , 其 概率 密度 函数 为 
1 @— (2—Hx) /20x 
V 20 


因此 , 说 我 们 的 分 布 趋 近 于 一 个 正 态 分 布 是 不 够 的 , 还 必须 指定 具体 的 均值 和 方差 . 
毫 不 奇怪 , 我 们 应 该 选择 爱 尔 朗 分 布 的 均值 和 方差 . 换 句 话说 , 当 n 较 大 时 , 参数 
为 入 和 mn 的 爱 尔 朗 分 布 的 概率 密度 函数 应 该 近似 于 参数 为 nA 和 nX? 的 正 态 分 布 
的 概率 密度 函数 . 
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我 们 在 图 13-3 中 绘制 了 XX 十 Y 的 概率 密度 函数 (X 和 是 相互 独立 日 均 服 
从 Exp(1) 的 随机 变量 ). 


图 13-3 六 十 Y 的 概率 密度 函数 图 , 其 中 X 和 YY 是 相互 独立 且 均 服从 Exp(1) 的 随机 变量 


0.35 上 
0.30 上 | 
0.25E| 
0.20 上 | 
0.15E| 
0.10 FE 


0.05 上 


2 4 6 8 10 


我 们 可 以 继续 下 去 . 在 图 13-4 中 , 我 们 分 别 绘制 了 8 个 和 30 个 相互 独立 且 均 


图 13-4 


0.14 
0.12 
0.10 
0.08 
0.06 
0.04 
0.02 


0.07 
0.06 
0.05 
0.04 
0.03 
0.02 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 


20 30 40 50 


十 Xs 的 概率 密度 函数 与 均值 和 方差 均 是 8 的 正 态 分 布 的 概率 密度 函数 (上 


图 ), Xi 十 … 十 X30 的 概率 密度 函数 与 均值 和 方差 都 是 30 的 正 态 分 布 的 概率 密度 
函数 (下 图 ), 其 中 X; 是 相互 独立 且 均 服从 Exp(1) 的 随机 变量 
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服从 标准 指数 分 布 的 随机 变量 之 和 的 概率 密度 函数 , 并 将 


不 错 (但 不 是 特别 好 ). 


与 对 应 的 正 态 分 布 进 
比较 . 请 注意 , 当 有 8 个 随机 变量 时 , 拟 合 情 况 并 不 好 , 但 30 个 随机 变量 的 拟 合 


为 什么 这 里 的 收敛 速度 要 比 均匀 分 布 时 的 慢 很 多 ? 当 记 


们 会 看 到 一 种 解释 . 
的 三 阶 中 心 矩 为 0， 
一 旦 n 达到 了 30, 了 


拟 合 是 否 合适 . 
13.2.3 ”服从 指数 分 布 的 随机 变量 的 例子 与 应 用 


当 描 述 齐 次 泊 松 过 程 


个 直 白 而 简单 的 原因 是 : 
且 指 数 分 布 不 是 这 样 的 . 让 ”= 30 


E 态 分 布 通 名 是 


是 


个 很 好 的 近似 . 你 可 


的 到 达 间 隔 时 间 长 度 时 , 指数 分 布 会 自然 


E 明 中 心 极限 定 到 


ba 


L 


以 目 


D 
| 


12.6 节 中 给 


描述 . 可 以 将 指数 分 布 看 作 几 何 分 布 的 连续 避 


4 形 , 而 几何 分 布 


是 离散 过 程 改 变 状态 所 需 的 伯 努 利 试验 次 数 . 相 比 之 | 
改变 状态 的 时 间 . 

在 现实 世界 中 , 恒定 速率 
球 比赛 中 的 得 分 近似 于 一 个 汇 


(或 单位 时 间 的 概率 ) 的 
松 过 程 . 然而 , 根据 参赛 


段 设 很 少 得 到 满 


球 队 的 情 


| 
人 L 


行 
还 


时 ,我 


纲 , 我 们 会 在 


. 例如 , 足 


5 匀 分 布 关于 其 均值 对 称 , 所 以 它 
因为 教材 中 会 经 常 提 到 ， 
来 判断 一 下 这 和 


h 


述 的 


F, 指数 分 布 描述 了 连续 过 程 


分 情况 是 不 一 相 
技术 恒定 和 天 气 条 伯 
分 布 来 很 好 地 逼近 . 

例子 : 不 妨 设 直到 下 次 进 球 得 分 所 需 等 待 的 时 间 可 以 月 


守 
= 
系 , 人 


六 
可 


不 变 的 情况 下 , 直到 下 次 进 球 


分 所 需 


况 、 天 气 状 况 等 
EF 的 ， 如果 我 们 把 注意 力 集中 在 某 场 特定 比赛 上 , 那么 在 3 


等 待 的 时 间 可 以 


分 布 来 模拟 . 上 半 场 没有 进 球 的 概率 是 多 少 (足球 的 
解答 : 概率 密度 函数 为 


1 上 
fx(x) = 4 30 
0 其 他 . 


因此 , 这 个 问题 的 答案 是 


LE 场 时 间 是 45 分 外 


用 


因 
球 队 
指数 


参数 为 30 分 钟 的 指数 


9 


)? 


中 


es/aodz = -es/a| 
45 30 


”er-3/2 ~ 92.3%. 
45 


个 


例子 : 通过 泊 松 分 布 建 模特 
们 可 以 用 指数 分 布 来 模拟 动作 


的 为 
电位 之 间 


列子 是 
的 时 间 . 


神经 元 发 出 的 动作 电位 . 因此 , 我 
假设 有 一 组 10 个 独立 的 神经 元 ， 


每 个 神经 元 平均 每 12 堂 秒 激活 
一 次 动作 电位 所 需 时 间 之 和 小 于 0.1 秒 
0.1 秒 是 100 上 毫秒 .) 


次 动作 电位 


这 10 个 神经 元 中 的 每 一 个 都 激活 
的 概率 是 多 少 ? (1 秒 等 于 1000 毫秒 , 因此 


解答 : 为 了 解决 这 个 问题 , 我 们 要 利 


并 求 蝇 


其 概率 密度 函数 在 z=0 和 x= 


用 参数 为 入 = 12 和 n= 10 的 爱 尔 朗 分 布 ， 
100 之 间 的 积分 : 
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373 


但 


分 部 积分 实在 太 痛 苦 了 ! 虽然 可 以 利 月 


这 么 做 的 一 一 但 是 正如 上 


的 了 


通过 


9 次 分 部 积 


化 


100 
| 


分 , 我 们 得 到 了 
1 002 136 


1210(10 一 1)! 


最 终 答 案 ， 


10-1 -zz/12 
dz. 
即 


41 
A 久 32.55%0. 


357 128 352e25/3 


你 应 该 会 注意 到 , 我 们 没有 给 出 这 个 结果 的 计算 过 程 . 这 是 有 原因 


E 态 分 布 来 近 


以 爱 尔 朗 分 布 . 


13.2.4 ”从 指数 分 布 中 生成 随机 数 


准 


发 展 数 学 型 


假设 我 们 可 


不 是 个 可 


么 就 可 以 轻松 地 生成 大 量 
函数 的 随机 变量 . 下 面 


E 论 是 一 回 


以 从 [0,1 


屋 


随机 变 


此 ， 关 


来 描述 这 利 


ER 


日 计算 机 来 求 这 个 积分 


的 : 进行 9 次 
事实 上 , 我 们 就 是 
| 方 莽 为 nX? 


节 所 述 , 我 们 真正 想 做 的 是 用 均值 为 nA 上 


~ 


方法 , 并 讨论 它 为 什么 有 月 


事 , 实现 它 又 是 另 一 回 事 ， 例 如, 我 们 当然 可 以 说 “从 标 


指数 分 布 中 生成 一 个 实数 ”, 然而 如 何在 实践 中 做 到 这 一 点 呢 ? 

上 的 均匀 分 布 中 随机 选择 数 . 正如 13.1.4 节 所 述 , 这 并 
的 假设 . 令 人 惊讶 的 是 , 如 果 我 们 可 以 在 [0,1] J 
体 地 说 , 是 可 以 生成 人 


均匀 地 生成 随机 数 , 那 
E 何 具有 显 式 累 积分 布 
. 


职 分 布 函 数 是 Fx. 妇 


区 一 


生成 随机 数 的 累积 分 布 法 : 设 X 是 一 个 随机 变量 , 它 的 概率 密度 函数 是 fx, 累 


[I 果 YY 是 一 个 服从 [0,1] 上 均匀 分 布 的 


Fx (Y). 


这 也 被 称 为 送 变 换 抽样 或 者 逆 变 换 法 


随机 变量 , 那么 


[0, 1] 中 均匀 地 生成 随机 数 , 这 样 就 


了 王 


这 真 的 非常 


个 问题 . 


大 2 


数 


什么 有 


述 . 


(1) 这 利 


我 们 会 详细 地 讨论 第 一 个 问题 , 现 如 


那么 , 这 种 方法 为 什么 有 
用 , 而 只 是 在 猜测 和 探究 结 


日 各 已 
木 用 


日 


特别 是 , 如 


方法 为 俐 
(2) 一 个 随机 变 


\ 可 思议 ! 我 们 


x 


| 么 有 


三 


里 


书 ? 


四 
个 . 


找到 2 


的 逆 累 积分 布 函数 是 一 


改 的 就 是 计算 逆 累 积分 布 函数 , 并 假设 可 以 在 
足够 了 ! 真是 太 神奇 了 ! 当然 , 我 们 还 有 如 下 两 


酒 襄 
全 漂亮 


月 ? 不 妨 设 Z = 本 IO7)， 现 在 , 我 们 3 


的 解析 表达 式 的 可 能 性 有 多 


E 来 证 明 指 数 分 布 有 个 很 好 的 逆 累 积分 布 函 


不 清楚 这 为 


现在 所 做 的 只 不 过 是 计算 概率 总 是 要 做 的 论 


的 累积 分 布 函数 , 那么 就 可 以 通过 求 导 来 算出 它 的 概率 
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密度 函数 . 在 证 明 中 , 非常 重要 的 一 点 是 ，Fx 是 个 不 减 的 函数 , 而 Fx 也 是 如 此 . 
利用 这 一 点 , 我 们 可 以 从 -ce < Fx1(Y) < z 中 推出 Fx(-00) <Y< Fx(z) (又 因 
为 Fx(-co) = 0, 所 以 上 式 就 变 成 了 0<Y < Fx(z)). 于 是 
Prob(2Z < z) = Prob(-% < Fx!'(Y) < 2) 
= Prob(0 < Y < Fx(z)) 


Fx (z) 
= ldy = FEx(2). 
0 


因此 , 2 的 累积 分 布 函数 与 X 的 相同 , 在 求 导 之 后 我 们 看 到 2 的 概率 密度 函数 也 
等 于 X 的 概率 密度 函数 . 这 迫使 Z = X. (实际 上 , 得 出 它们 具有 相同 的 累积 分 布 
函数 就 足够 了 . 然而 , 更 自然 的 做 法 是 考虑 它们 的 概率 密度 函数 , 所 以 我 们 还 说 明 
了 两 者 的 概率 密度 函数 也 是 相同 的 .) 
好 的 , 这 个 方法 可 行 , 但 人 们 是 怎么 想到 这 种 方法 的 呢 ? 本 书 的 目的 之 一 是 帮 
助 你 从 概率 的 角度 (或 者 数学 的 角度 ) 来 思考 . 我 们 不 想 直 接 给 出 一 系列 代数 运算 ， 
而 是 希望 你 能 了 解 给 出 这 些 代数 运算 是 如 何 给 出 的 理由 ,从 而 能 试 着 采用 类 似 的 
方法 来 解决 以 后 遇 到 的 问题 . 那么 , 我 们 回 过 头 来 思考 一 下 , 从 给 定 分 布 中 生成 数 
是 什么 意思 . 如 果 想 利用 X 的 分 布 生成 随机 数 , 那么 在 [z,z+ Az] 上 生成 一 个 数 
的 概率 一 定 是 Fx(z++Az) 一 Fx(x). 如 果 Y 是 一 个 服从 [0,1 上 均匀 分 布 的 随 书 
变量 , 那么 Y 在 区 间 [a,4] c [0,1] 上 取 值 的 概率 就 是 5 一 a. 这 缠 含 着 以 下 决策 规 
则 : 生成 Y; 如 果 并 在 区 间 [Fx (x), Fx(z 十 信 )] 上 取 值 ,那么 X 的 值 就 要 取 x. 
Az 一 0 时 , 区 间 会 缩小 成 一 个 点 , 基本 上 可 以 说 , 与 Y 相关 的 X 的 取 值 要 满 
y= Fx(z) 或 者 z= Fx (人 
我 们 来 考察 一 个 随机 变量 , 它 服 从 参数 为 和 的 指数 分 布 . 它 的 概率 密度 函数 为 
| a 若 x20 
0 其 他 . 
只 要 对 上 述 函 数 积分 , 就 能 得 到 累积 分 布 函数 . 当 x < 0 时 , 累积 分 布 函数 显然 是 
0; 当 z>0 时, 有 


这 


后 于 


fx(7z)= 
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因此 , 当 z >0 时, 有 
Fwx(z) = 工 一 erz/^. 
现在 , 我 们 把 上 述 过 程 颠倒 过 来 : 如 果 Fx(z) = y, 那么 
y= 二 1 e 一 zZ/ 和 
ez 人 /一 1 一 y 
一 天 二 = log(1 一 切 
z 一 一 log( —Yy) = Fx (y). 
(为 了 验证 这 就 是 Fx 在 y 处 的 逆 , 通过 直接 计算 来 证 明 Fx (Fx1(y)) = y.) 
我 们 的 答案 合理 吗 ? 再 次 强调 , 到 目前 为 止 , 提出 这 个 问题 己 访 已 经 成 为 了 你 
的 习惯 , 你 应 该 主动 想到 . 我 们 一 直 在 验证 公式 的 合理 性 . 幸运 的 是 , 这 个 公式 有 


很 多 可 以 验证 


的 东 [ 


6. 首先 注意 到 , 这 个 公式 与 


疑 , 因 


要 问 的 是 , 对 数 是 否 


否 有 意 


5X 


率 是 0.) 最 后 , 当 我 
负 的 ! 一 切 都 没 问题 


门 看 到 仙 号 


时 , 第 A 


的 结果 就 是 负 的 . 这 中 
除了 通过 


13-5 中 , 我 们 把 从 [0,1 上 的 均匀 分 布 
结果 进行 了 比较 . 毫 不 奇怪 , 如 果 1 
0.01 大 小 的 分 段 则 隔 , 并 且 有 100 000 个 值 


转换 的 


查看 公式 来 验证 名 


为 它 应 该 等 于 参数 为 和 的 指数 分 布 的 概率 密度 ! 我 们 还 能 验证 
答案 是 肯定 的 . 因为 Y 服从 [0,1 上 的 ] 
0 和 yy 芯 1, 所 以 对 数 是 有 定义 的 . ( 当 y = 1 时 , 对 数 无 定义 , 但 这 种 情况 发 4 
反应 可 能 是 感到 恐慌 ， 
. 记 住 , 0 和 1 -过 所 以 取 对 数 的 值 是 小 于 1 的, 那么 得 到 
有 的 负 号 是 为 了 让 最 终 的 表达 式 为 正 . 


入 有关. 如 果 与 入 


因为 概率 密度 


T 


答案 的 合理 


增加 点 的 数量 ， 


性 , 当然 也 可 以 借助 于 一 些 数 人 
中 模拟 的 10 000 个 值 与 用 标准 指数 分 布 


, 此 时 与 指数 分 布 的 拟 合 


模拟 . 在 


E 关 , 那 就 很 可 
什么 ? 接 下 来 
的 匀 分 布 , 即 
mn 


是 非 


那么 拟 合 度 会 更 高 . 


利用 


图 13-5 


100 000 个 数 (下 图 ), 并 把 这 些 结果 与 标准 


累积 分 布 函数 法 4 


下 
E 成 的 10 000 


个 值 


会 相当 好 . 


使 


用 


3 
上 图 ) 以 及 从 标准 指数 分 布 中 随机 选 出 的 
上 数 分 布 进行 比较 
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13.3 “ 习 


习题 13.3.1 ”为 什么 不 存在 服从 (0, co) 上 均匀 分 布 的 
习题 13.3.2 ” 设 X ~ Unif(a,b), 通过 计算 E[X?] 一 
时 , 最 难 的 部 分 是 进行 代数 化 简 


这 种 方法 会 上 


题 


随机 变量 ? 


E[X]? 来 求 出 X 的 方差 
另 一 种 方法 更 简单 吗 ? 


. 在 计算 方差 


习题 13.3.3 ”给 出 关于 X ~ Unif(a,b) 的 一 个 量 纲 分 析 论 述 . 肯定 存在 一 个 与 a 和 “5 无关 
的 常数 C, 使 得 Var(X) = C(b 一 a)?. 那么 ,C 的 取 值 范围 是 什么 ? 
度 函 数 Pr(Z = z) (ZE =X 二 YY, 其 中 


习题 13.3.4 ”不 利用 对 称 性 , 通过 求 积 分 来 推导 概率 密 
X 和 YY 是 相互 独立 且 服 从 [0,1] 上 
习题 13.3.5 ” 设 入 ,Xo,:…. 是 相互 独立 


的 色 分 布 的 随 书 


变量 ), 并 验证 之 前 得 至 


的 答案 . 


均 服从 [0, 1] 上 均匀 分 布 的 随机 变量 . 基于 对 Xi 


以 及 Xi 十 X2 的 概率 密度 函 


是 Xi + Xz 十 Xs 十 Xa 的 概率 密度 函数 (或 
习题 13.3.6 ”通过 直接 求 积分 , 我 们 得 至 


于 中 心 ( 即 刀 *) 对 称 的 , 这 


数 的 了 解 , 更 容易 找 至 


两 者 一 相 


即 添加 0, 证 明 : 
b 
ex / 


2 
2 


dz 
b 


-/ mbta) dr 
2 b—a 


把 计算 均值 的 分 析 过 程 补充 完整 . 能 不 


习题 13.3.7 ”之 前 通过 计算 E[(X 一 x)? 
E[X?] -下 [X]2 来 计算 方差 . 你 认为 哪 种 积分 会 更 简 


能 
]， 


-= 
ef dz 
2 J, J, ba 


我 们 求 出 了 X ~ Exp( 和 ) 的 方差 , 现在 利用 
和 (或 者 难度 大 致 相同 )? 


习题 13.3.8 ” 设 随 机 变量 X 服从 参数 为 和 的 指数 分 布 , 求 出 E[VX]. 
习题 13.3.9 ” 设 随机 变量 X 服从 [0,n] 上 的 均匀 分 布 , 求 出 E[1/XI]. 


习题 13.3.10 ”如果 一 个 随机 变革 


时 服从 区 间 (a,5) 上 的 均匀 分 布 , 那么 求 出 它 所 有 的 失 . 


| Xi 十 X2 十 Xs 的 概率 密度 函数 , 还 
E 难 )? 求 出 两 者 的 概率 密度 函数 . 
上 了 X ~ Unif(a,5) 的 均值 . 注意 概率 密度 函数 是 关 
样 就 可 以 避免 找 出 原 函 数 . 利用 数学 中 最 重要 的 技巧 之 一 ， 


| b+a 
2 


13.3 习 题 377 


虽 过 过 


| 


My 
疯 


MY 
各 


My 


My 


13.3.17 以 上 一 
数 定义 的 数 能 构成 一 个 区 间 . 
13.3.18 设 汪 和 


13.3.11 ”如 果 一 个 随机 变量 服从 参数 为 A 的 指数 分 布 , 那么 求 出 它 所 有 的 算 . 


13.3.12 ”计算 Prob(X > 3), 其 中 X 服从 参数 为 1 的 指数 分 布 . 


13.3.13 ”计算 Prob(X > 2) 或 Prob(X > 四, 其 中 X 服从 参数 为 1 的 指数 分 布 . 
13.3.14 ” 设 随机 变量 X 服从 参数 为 和 的 指数 分 布 , X 在 哪个 区 间 内 取 值 时 概率 会 等 


于 50%? 换 句 话说 ， 


求 出 cx 和 以 , 使 得 Pr(X < wy) = Bet > ba) = 0.25. 


13.3.15 ” 设 随 机 变量 X 服从 [0,n] 上 的 均匀 分 布 , 求 出 eX 的 概率 密度 函数 . 
题 13.3.16 ” 设 随机 变量 X 服从 参数 为 和 的 指数 分 布 , 求 出 X 的 中 位 数 . 记 住 , 对 于 一 个 


具有 连续 概率 密度 函数 的 随机 变量 , 它 的 中 位 数 £ 就 是 满足 Pr(X < =Pr(Xz = 


1/2 的 点 . 中 位 数 大 于 还 是 小 于 均值 ? 它们 之 间 相 差 多 少 ? 


min(X,Y) 和 max 


13.3.19 设 X 服从 区 间 [0,n] 上 的 均匀 分 布 ,Y 服从 参数 为 的 指数 分 布 , 求 H 


min(X,Y) 和 max 


13.3.20 设 X 月 


题 为 基础 , 找到 一 个 分 段 连续 的 概率 密度 函数 , 使 得 全 体 满足 上 述 中 位 


HY 是 相互 独立 的 随机 变量 , 它们 都 服从 [0,m] 上 的 均匀 分 布 , 求 出 
X,Y) 的 PDF. 


三 


X,Y) 的 PDF. 
民 从 参数 为 和 x 的 指数 分 布 , 服从 参数 为 Xy 的 指数 分 布 , 求 H 


三 


min(X,Y) 和 max 


13.3.21 ” 设 钴 和 YY 是 相互 独立 的 随机 变量 , 它们 均 服 从 [0,1] 上 的 均匀 分 布 . 设 随 机 


X,Y) 的 PDF. 


变量 2 服从 min(X,Y) 到 max(X,Y) 上 的 均匀 分 布 . 你 能 得 出 哪些 关于 2 的 信息 ? 2 


的 期 望 值 是 多 少 ? 方差 是 多 少 ? 


13.3.22 ” 当 n= 


情形 的 ” 与 参数 所 


2 时 , 我 们 得 到 了 爱 尔 朗 分 布 的 概率 密度 函数 . 尽 可 能 多 地 求 出 一 般 
对 应 的 概率 密度 函数 . 


13.3.23 ” 求 E[e'*], 其 中 X 服从 参数 为 和 的 指数 分 布 , 并 有 t < 1/ 入 . 
13.3.24 ”对 于 参数 为 入 入 n 的 爱 尔 朗 分 布 , 计算 其 均值 与 方差 . 


13.3.25 ”图 13-4 


中 的 预测 似乎 与 概率 不 符 , 你 是 否 感到 惊讶 ? 为 什么 ? 


13.3.26 ” 设 久 是 一 个 服从 指数 分 布 的 随机 变量 . 证 明 : Prob(X > z+alX > a) = 


Prob(X > 7). 


13.3.27 ”指数 分 布 为 什么 可 以 用 来 估算 某 些 物体 骨 溃 或 失效 所 需 的 时 间 ? 在 什么 情况 


下 , 指数 分 布 不 能 


j 来 估算 物体 何 时 崩溃 ? 


题 13.3.28 ”粒子 具有 某 给 定 寿命 的 概率 服从 参数 为 i 的 指数 分 布 , 其 中 t 是 前 


2/c2 


止 粒子 的 平均 寿命 
的 平均 寿命 大 约 是 


v 是 粒子 运动 的 速度 , c 是 光速 、 约 为 3 亿 米 / 秒 . 已 知 一 个 静止 中 子 
880 秒 , 如 果 它 正在 快速 移动 , 速度 大 约 是 1400 万 米 / 秒 , 则 其 寿命 超 


过 10 分 钟 的 概率 是 多 少 ? 


13.3.29 设 针 月 
n E {1,2,3,4,5}. 画 出 XX 十 Y 的 概率 分 布 . 
13.3.30 ”对 于 下 列 各 式 ， 如 果 极 限 存在 ， 则 求 出 极限 值 ， 如果 极限 不 存在 ， 请 给 出 解 


释 : (a) limz_o(er 


有 从 参数 为 入 = 1 的 指数 分 布 , Y 服从 [0,n] 上 的 均匀 分 布 , 其 中 


I 


— 1)/x, (b) limzo(cos? x — 1)/7x3, (ce) limzi(x? — 1)/(x? — 1), 


: 均匀 分 布 与 指数 分 布 


(d) lim ,oz2004/er/2001，(ej lims ,oo £1/200"7 /elo8(o8(®) 和 (f) lim ozlog(z). 


习题 13.3.31 ”在 微 积 


分 


式 是 0/0, 所 以 可 以 利 


什么 不 对 或 危险 的 
习题 13.3.32 ”Tim 和 
六 


服从 该 时 间 段 内 
家 , 求 出 他 们 准时 
习题 13.3.33 ”老虎 机 


[ 袜 队 的 比赛 ， 从 人 


至 


课 上 , 学 生 要 计算 lims_,o 2 外 . 人 


大 


也 方 吗 ? 


的 均匀 分 布 . 如 
I 达 赛 场 的 概率 . 


有 两 个 独立 


布 的 随机 数 . 如 果 
率 是 多 少 ? 


习题 13.3.34 。 Jimmy 


返 要 人 花费 5 分 旬 


网 


] 洛 必 达 六 


个 数 之 种 


则 ， 


此 该 极限 就 等 


Lisa 住 在 纽约 的 奥 尔 巴 尼 , 他 们 打算 带 着 孩子 去 芬 威 球场 观看 波 士 
也 们 家 到 芬 威 球场 所 花费 的 时 间 介 于 150 分 钟 和 240 分 钟 之 i 


果 比 赛 在 晚上 7 点 钟 天 


的 随机 数 和 9 
\ 于 20 或 大 于 


习题 13.3.35 ”在 马上 


剑 


2 天 一 次 车 祸 . 下 


期 至 少 发 9 


在 当地 一 家 冰激凌 店 ] 了 
平均 每 小 时 有 15 个 顾客 . 在 发 现 巧 克 力 
.在 顾客 到 来 之 前 , Jimmy 能 够 成 功 返 
兰州 的 奥 德 瓦 拉 , 车 祸 之 间 的 时 间 可 以 通过 指数 分 布 来 准确 


悚 


[ 作 , 顾客 到 


会 说 你 赢 


得 大 奖 . 


F lim。 .0 sost) = 1， 这 利 


岂 们 认为 这 很 容易 : 这 个 极限 的 形 


全 


个 


达 


选 购 冰 激 凌 是 


味 冰 激 凌 


E 4 次 车 祸 的 概率 是 多 少 


己 经 卖 


日 


的 概率 是 多 少 ? 


完 后 , 他 决定 去 商 


论述 有 


司 , 并 且 
F 始 , 他 们 会 在 下 午 3 点 50 分 离开 


成 器 , 它们 都 会 生成 一 个 服从 [0, 80] 上 均匀 分 


F 140, 那 你 就 得 大 奖 的 概 


松 过 程 ， 


六 


区 


4 建 模 ,3 


店 补 货 , 往 


均 
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训 无 疑问 , 正 态 分 布 是 最 重要 的 分 布 之 一 . 不 仅 在 概率 论 中 , 正 态 分 布 对 于 整 
个 数学 和 科学 领域 都 非常 重要 . 这 主要 是 因为 中 心 极限 定理 : 在 很 多 情况 下 , 相互 
独立 的 随机 变量 之 和 会 收敛 于 正 态 分 布 . 这 里 的 条 件 通常 较 弱 , 在 许多 理论 和 实际 
问题 中 都 能 得 到 满足 . 我 们 会 在 第 20 章 中 详细 地 介绍 中 心 极限 定理 . 本 章 的 目的 
是 介绍 正 态 分 布 及 其 性 质 , 首先 给 出 正 态 分 布 的 定义 . 


正 态 分 布 : 如 果 随 机 变量 X 的 概率 密度 函数 是 

1 
V2no? 
那么 X 就 服从 均值 为 / 且 方 差 为 o? 的 正 态 分 布 , 并 记 作 X ~ N(n,o0?). 这 个 
概率 密度 函数 非常 重要 , 也 说 X 服从 高 斯 分 布 (均值 为 j, 方差 为 c2)， 如 果 六 
服从 标准 正 态 分 布 , 那么 X~ N(0,1). 如 果 X 服从 正 态 分 布 , 有 时 也 说 X 遵循 
钟 形 曲线 . 


@-(e—/?/207 


fx(7) 


注意 , 在 NUs o2) 中 , 第 二 个 参数 就 是 方差. 因此 , 如 果 基 w_ N(0,4), 那么 
就 服从 均值 为 0 且 方 差 为 4 的 正 态 分 布 , 所 以 X 的 标准 差 就 是 2， 在 图 14-1 中 ， 
我 们 绘制 了 三 个 正 态 分 布 


一 5 0 5 


图 14-1 三 个 正 态 分 布 的 图 形 , 它们 的 均值 都 是 0, 方差 分 别 是 1/2、1 和 2 


与 之 前 介绍 的 其 他 分 布 不 同 , 我 们 并 不 清楚 正 态 分 布 是 不 是 分 布 ! 它 的 概率 密 


度 函 数 显然 是 非 负 的 , 但 其 积分 值 是 否 等 于 1? 遗憾 的 是 , 正 态 分 布 要 比 其 他 概率 
密度 函数 难得 多 . 这 是 因为 , 对 于 正 态 分 布 的 概率 密度 函数 而 言 , 任何 一 个 初等 函 
数 都 不 是 它 的 原 函数 . 这 意味 着 我 们 无 法 写 出 累积 分 布 函数 , 而 且 必须 借助 级 数 展 
开 和 数值 通 近 . 

尽管 这 已 经 很 糟糕 了 , 但 情况 可 能 会 更 糟 . 令 人 惊讶 的 是 , 虽然 它 的 累积 分 布 
函数 没有 漂亮 的 解析 表达 式 , 但 有 种 初等 方法 可 以 证 明 曲 线 下 方 的 面积 是 1. 我 们 
首先 给 出 考察 这 个 问题 的 两 种 方法 , 然后 按照 与 其 他 章节 相同 的 模式 展开 (计算 均 
值 与 方差 , 考察 服从 正 态 分 布 的 随机 变量 之 和 , 等 等 ). 


14.1 确定 标准 化 常数 


标准 化 常数 理论 是 这 个 学 科 中 最 美妙 的 部 分 之 一 . 它 告 诉 我 们 , 对 于 任意 一 个 
积分 值 有 限 的 非 负 函数 , 通过 简单 的 乘法 就 能 将 其 转化 为 概率 密度 函数 . 到 目前 为 
止 , 我 们 还 不 能 马上 看 出 这 个 理论 为 什么 如 此 重要 和 有 用 , 而 不 仅仅 是 个 简单 明显 
的 事实 ， 当 考察 多 元 函数 时 , 它 会 变 得 非常 有 用 , 我 们 可 以 对 其 中 一 些 变量 求 积 分 
并 保留 其 余 变 量 . 在 16.3.2 方 中 , 我 们 会 更 详细 地 讨论 这 个 问题 . 目前 先 陈 述 这 种 
方法 , 并 将 其 应 用 于 正 态 分 布 的 概率 密度 函数 . 


标准 化 常数 理论 : 设 9 是 一 个 非 负 实 值 函数 , 并 且 满 足 


共生 9g(z)dz > 0. 


如 果 ec < co, 那么 f(x) = g(x)/c 是 一 个 概率 密度 函数 . 


这 个 证 明 非 常 直观 : 我 们 只 需要 验证 概率 函数 成 立 的 两 个 条 件 . 非 负 性 很 容易 
证 明 : 因为 g(z) >0 且 c>0, 所 以 g(z)/c 0. 现在 只 需要 证 明 了 的 积分 值 为 1. 


我 们 有 
[rvs=f a= 3 oar = =1 


现在 回 过 头 来 看 看 正 态 分 布 , 它 的 概率 密度 函数 为 
PE 
V 20? 
显然 , 这 个 概率 密度 函数 是 非 负 的 . 如 果 能 证 明 它 有 一 个 有 限 的 非 零 积分 , 那 就 一 
定 存在 某 个 标准 化 常数 可 以 把 它 变 成 一 个 概率 分 布 . 我 们 不 知道 这 个 常数 具体 是 多 
少 , 但 知道 它 一 定 存 在 . 


14.1 确定 标准 化 常数 ”381 


几 次 


域 上 积分 的 2 倍 (参见 A.4 节 ). 最 后 , 我 们 会 把 积分 分 成 两 部 分 ， 


该 函数 的 积分 也 是 非 负 的 . 我 们 


另外 还 会 用 到 , 偶 函 数 在 对 称 


来 找 一 下 积分 值 的 上 界 . 为 了 简化 积分 , 要 做 
区 域 上 的 积分 就 等 于 该 函数 在 半 个 区 
因为 根据 v 的 不 


同 大 小 , 会 选择 不 同 的 函数 作为 e-” 的 上 界 (参见 习题 14.6.1). 于 是 
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因此 , 对 于 任意 的 上 4 和 o, 上 述 积分 值 均 有 限 , 从 而 可 以 转化 成 一 个 概率 密度 函数 . 


门 很 快 就 要 算 


因为 目前 只 需要 说 明 


二 | 
La 


这 个 积分 值 是 有 限 的 , 所 以 可 


以 进行 粗略 的 估计 ， 


但 是 我 


[= 


的 精 


Be 
D 已 


于 原 
确实 等 


函数 无 法 


六 1, 所 以 


得 
二 


既然 


| 经 订 


E 明 了 这 个 函数 可 以 调整 


值 . 试 着 求 出 一 个 量 的 数量 级 
用 解析 表达 式 来 描述 , 所 以 这 个 积分 很 
到 上 界 1.543 49 是 相当 不 错 的 . 

, 那么 我 们 需要 说 


人 


E 明 调整 因子 就 是 


话说 , 现在 要 ii 


E 明 , 引入 因子 1/V2rc2 了 


门 有 两 种 方法 . 


和 


有 一 和 


玫 


有 点 困惑 , 因为 这 里 只 有 一 个 积分 变量 一 一 怎么 利 月 


E 是 为 了 让 上 述 函 数 成 为 概率 密 
Fh 是 利用 多 元 微 积 分 的 精彩 技巧 . 在 读 完 这 人 句 话 后 
分 的 知识 呢 ? 


》 


多 元 微 积 


项 很 有 价值 的 技能 . 
作 计 算 . 我 们 马上 就 会 看 到 它 


1. 换 句 


你 应 该 会 


这 里 的 


思路 是 z? 看 起 来 就 像 22 十 刀 的 一 半 , 而 z2 十 好 在 极 坐标 下 就 是 r?. 关键 是 要 对 
积分 平方 , 进而 利用 圆 的 相关 性 质 , 这 可 能 是 你 见 过 的 最 奇怪 的 句子 乙 一 了 . 


在 给 出 一 些 细节 之 后 , 一 切 都 会 变 得 清晰 起 来 . 令 
TH Ia) = I ez /20° dx. 
_oo V2ma2 


mt 
a 


注意 到 ， 


I(1,o0) = 1(0,1) 
对 所 有 的 pe 均 成 立 . 这 里 只 是 做 了 变量 替换 ; 


2 
I(1,0) 2 [ e—(2—/)?/20° gy 


Co 2Ta2 
一 1 ou/0)/2j dz 
WA 08 0 
1 人 2 
一 Z /2 至 
三 er2/2dz = I(0,1). 
V2T > 


与 上 一 个 论述 (只 需要 证 明 积分 值 是 有 限 的 ) 不 同 , 此 时 将 因子 2 留 在 指数 内 会 更 
方便 . 
很 好 , 现在 问题 就 简化 成 了 证 明 I(0,1) = 1. 这 个 结论 为 什么 成 立 ? 这 个 结果 
实际 上 为 我 们 提供 了 如 何 继续 下 去 的 线索 . 这 是 种 非常 巧妙 的 思路 . 不 要 灰心 , 也 
不 必 担 心 想不到 这 种 技巧 , 因为 随 着 经 验 的 增加 , 你 会 更 容易 看 到 这 种 关联 . 好 了 ， 
看 到 就 应 该 想到 圆 , 又 因为 这 里 有 一 个 变量 , 所 以 应 该 想到 极 坐标 ; 


X= recos0, Y = 7sn0 reE|l0co， 0el02m，dzdy = 7rdrd0. 
现在 是 使 用 技巧 的 时 候 了 : 
| 2 /和 2 
1(0,1) = | 一 -er /2dqz = [ME 


co V27 


HI 


之 所 以 得 到 这 个 等 式 , 是 因为 x 和 y 都 是 虚拟 变量 . 现在 考虑 7(0,1)?, 把 其 中 一 
个 了 看 作 z 的 积分 , 另 一 个 工 看 作 y 的 积分 . 这 的 确 是 种 了 不 起 的 巧妙 思路 (有 
些 人 称 之 为 极 坐标 技巧 )， 我 们 不 能 在 两 个 积分 中 使 用 相同 的 虚拟 变量 , 因为 这 样 
会 引起 混淆 .然而 , 使 用 两 个 不 同 的 字母 会 让 我 们 想到 多 元 微 积分 中 的 某 些 技巧 . 
基本 上 , 当 你 无 法 解决 涉及 两 个 或 更 多 个 变量 的 积分 时 , 可 以 试 试 以 下 两 种 方法 之 
一 : (1) 富 比 尼 定 理 (改变 积分 次 序 ), (2) 变量 替换 . 

对 我 们 来 说 , 富 比 尼 定 理 没什么 帮助 , 但 是 把 笛 卡 儿 华 标 z,y 替换 成 极 坐 标 7,9 
却 很 有 用 .( 对 于 这 种 做 法 , 我 们 还 可 以 从 另 一 个 角度 来 考察 , 注意 这 里 有 e-” dz. 虽 
然 该 函数 的 积分 很 难 计算 , 但 e-*xdzx 的 积分 很 简单 . 因此 , 我 们 要 想 办 法 插入 一 
个 z. 显然 不 能 直接 插入 变量 , 但 如 果 变 换 成 极 坐标 , 那么 dzdy 就 变 成 了 rdrdb， 
这 样 就 引入 了 一 个 容易 处 理 的 积分 .) 于 是 


Sg i %9， 村 
1(0,1)? =| 和 于 eqn [ -= ery /2dy 
三 GO V2n 


el J 小 e- (2 49)/2drdy 
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14.2 均值 和 方差 383 


1 Oo 2 : 
[ . e-7 /2rdrdb 
2 FJ Rs 
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二 人 erar / do 
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这 证 明了 它 是 一 个 概率 密度 函数 (1(0,1) 显然 是 正 的 , 所 以 它 一 定 等 于 1). 

上 述 计算 是 个 数学 令 人 泪 形 的 例子 . 逐 行 阅读 , 这 里 的 论述 并 不 难 理解 . 难点 
在 于 , 如 何在 类 似 的 问题 中 重 现 这 种 巧妙 的 证 明 思路 , 也 就 是 说 , 学 着 如 何 跳出 固 
定 思 维 模式 去 求 积分 的 平方 . 首先 想到 极 坐 标 技巧 的 人 应 该 得 到 赞扬 , 因为 这 是 一 
种 真正 的 原创 方法 . 我 能 给 出 的 最 好 建议 就 是 做 大 量 的 数学 题 . 做 的 问题 越 多 , 解 
决 问题 的 方法 就 越 多 , 拥有 的 技术 和 技巧 也 就 越 多 . 要 想 流 利 地 说 一 门 语 言 需要 花 
费 些 时 间 , 但 前 提 是 你 必须 去 听 这 种 语言 , 否则 没有 任何 机 会 . 很 多 数学 问题 都 可 
以 归结 为 模式 识别 , 即 明 白 如 何 正确 地 看 待 问题 . 你 付出 的 努力 越 多 , 事情 就 会 变 
得 越 容易 . 


14.2 ”均值 和 方差 


设 X~ N(1,o?). 这 意味 着 X 服从 正 态 分 布 , 其 概率 密度 函数 为 : 
1 
V2Ta2 
在 上 一 节 中 , 我 们 已 经 证 明了 这 是 一 个 概率 密度 函数 , 因为 它 的 积分 值 为 1. 现在 
是 时 候 计算 均值 了 , 它 应 该 是 六 (类似 地 , 方差 应 该 是 o?). 把 它 改写 成 更 具 启 发 性 

的 形式 : 


(0-1)2/207 


f(z) = 


en 


V2no? 
1 1/z—u\ Yl1 
oa 
不 难看 出 , 概率 密度 函数 与 (x - 1)/o 有 关 , 这 意味 着 均值 是 1, 而 标准 差 是 o. 为 
什么 呢 ? 为 了 看 出 均值 是 凡 我 们 注意 到 /+a 与 1 一 a 的 函数 值 是 相等 的 , 所 以 概 
率 密度 函数 关于 z = / 对称, 因此 j 就 是 均值 . 现在 来 证 明 这 些 事实 , 从 而 说 明 把 
具有 上述 概率 密度 函数 的 随机 变量 记 作 N(p,o?) 是 合理 的 . 


首先 来 看 一 下 均值 . 这 里 一 定 要 小 心 一 点 , 用 wx 来 表示 均值 . 这 样 做 的 原因 
是 , 在 概率 密度 函数 中 已 经 出 现 了 符号 几 如 果 用 j 来 表示 均值 , 就 可 能 导致 用 同 


一 个 符号 表示 两 个 不 同 值 的 错误 稍 后 会 简要 地 证 明 jwx = , 但 现在 我 们 不 知道 
这 两 个 值 是 相等 的 ! 
因为 这 个 分 布 关于 对 称 , 所 以 我 们 自然 会 猜想 均值 应 该 是 1. 现在 来 给 出 证 
均值 的 定义 可 知 
> 1 _(z_1)2/202 
mx 人 > ex-A) /20 dx. 
接 下 来 有 很 多 方法 可 以 继续 , 下 面 是 我 最 喜欢 的 技巧 之 一 . 看 看 概率 密度 函数 是 如 
何 只 取决 于 x 一 的? 这 提醒 我 们 应 该 进行 变量 替换 , 令 尺 二 zx 一 ,于 是 z=uth 
且 dz = du. 由 此 可 得 


:3 1 
3 Vk 2 V 27n0? 
二 人 24 ， ez-m2?/2o qa i 网 1 e-(z-m2?/2c2dw 


明 . 


2 2 
eu /20 du 


V2Ta2? _00 V2Ta2? 
注意 , 第 二 个 积分 非常 简单 : 它 就 是 1, 因为 它 是 概率 密度 函数 的 积分 ! 因此 
一 号 4， ez- 内 /20° du 十 
EX V2no2 ps 


现在 只 需要 证 明 第 一 个 积分 是 0. 最 简单 的 方法 是 , 注意 到 这 是 奇 函 数 在 对 称 区 域 
上 的 积 4 

即使 没有 想到 这 一 点 , 问题 仍然 可 以 解决 . 我 们 可 以 试 着 利用 分 部 积分 法 , 但 
是 必须 非常 小 心 , 否则 就 会 犯 概率 中 最 常见 的 错误 之 一 ! 我 们 会 故意 稍微 粗心 一 
犯 个 错 尔 能 不 能 发 现 ! 现在 有 


1 和 2 1 多 2 udu 
—u’ /20 —u’ /20 
4 一 6 du 一 一 一 e 一 一 . 
V2Ta2? > 27 0o 


接 下 来 做 变量 替换 . 如 果 令 t= /2c2, 那么 dt = wudu/o, 从 而 有 


/ Os 1 e—u /20°g = e-tdt 
一 co V2755 V2n 


= - 遍 [ e | 
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天 啊 ! 到 底 发 生 了 什么 事 ? 我 们 算 的 是 奇 函 数 在 对 称 区域 上 的 积分 , 结果 怎么 可 能 
是 正 的 呢 ? 原因 是 在 求 积分 时 , 我 们 犯 了 一 个 最 常见 的 错误 一 一 没有 正确 地 改变 积 
分 限 ! 记 住 , v 的 积分 区 域 是 从 -ce 到 co. 如 果 让 t= /2c2, 那么 t 的 积分 区 域 
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就 变 成 了 从 ce 到 oo. 这 是 很 荡 诸 的! 问题 在 于 , 我 们 的 变量 替换 在 (00,o00) 上 是 

不 可 逆 的 , 因为 (-o0,0] 和 [0, oo) 都 会 映射 成 [0, oo)， 因 此, 要 把 积分 划分 成 两 部 

分 , 从 而 使 得 变量 替换 在 每 个 区 域 上 都 是 可 逆 的 . 
让 我 们 再 试 一 次 , 但 这 次 要 更 加 小 心 . 现在 有 


0 oo 
1 2 1 2 
—u’ /20 d kh —u’ /20 
二 u e 2 十 u e du 
V 2Ta2 0 V 2Ta2 
9 1 二 是 生 2 a 二 六 和 2 Udu 
Pa ev /20 uu’ /20 
一 co V 玩 V Vm 0 


al i —t 
= 人 7 e “dt+ J TR e dt. 
接 下 来 有 两 种 方法 . 当然 , 一 种 方法 是 直接 计算 两 个 积分 . ee 那 
么 我 们 会 看 到 所 有 项 都 消 掉 了 , 最 终 得 到 了 0. 另 一 种 方法 是 , 注意 到 [g(t)dt = 
一 户 g(t)dt. 一 旦 把 积分 上 下 限 颠 倒 过 来 , 那么 曲线 下 方 区 域 的 面积 就 变 成 ] oe 
利用 这 一 点 , 我 们 有 


e—u /20° gy 


VE V 二 
etdt = 0. 


o 1 
| n° ur V2no? 
这 样 就 完成 了 均值 是 j 的 证 明 . 换言之 , jx = 
现在 来 考察 方差 . 同样 , 我 们 希望 方差 是 o?. 但 是 , 目前 我 们 并 不 知道 这 个 结 
果 , 所 以 必须 小 心 . 在 一 个 方程 中 , 不 要 把 同一 个 符号 用 于 两 种 不 同 的 目的 . 因此 ， 
现在 用 o 来 表示 方差 , 当 我 们 发 现 o% = o? 时 , 不 必 过 于 惊讶 . 
我 们 采用 的 方法 是 , 把 (zx 一 jx)? 乘 以 概率 密度 函数 , 然后 再 对 结果 求 积分 . 幸 
运 的 是 , 我 们 知道 Ux = jy, 所 以 方差 就 是 


e— (7-H)°/20° qzy. 


1 
福 -| C- 小 -有 
现在 , 通过 变量 替换 来 简化 上 式 . 令 w= (z 一)/o, 于 是 dw=dz/o 有 (xz 一 1)?= 
o2w?. 因为 对 变量 进行 的 是 线性 替换 , 所 以 积分 上 下 限 会 很 好 地 改变 . x 的 积分 区 
域 是 从 -co 到 ceo, 而 w 的 积分 区 域 也 是 从 -co 到 co, 于 是 有 


3 ~ 2 2 1 —w?2/2 
ox 一 OU e odw 
一 DO 


现在 利用 分 部 积分 法 . 必须 把 w?exp( 一 w?/2)dz 划分 成 udv 的 形式 . 我 们 很 
然 地 想到 让 w= w? 且 dv = exp( 一 w?/2)dw, 但 这 种 做 法 并 不 奏效 . 这 并 不 难 理解 : 
当 进 行 分 部 积分 时 , w = w? 被 蔡 换 成 了 du = 2wdw, 这 样 就 降低 了 w 的 肾 . 困难 
在 于 我 们 要 找到 vw, 而 exp( 一 w?/2) 的 原 函 数 无 法 用 解析 表达 来 描述 . 因此 , 这 里 要 
使 用 一 些 巧妙 的 思路 , 而 不 是 考虑 典型 的 分 部 积分 问题 . 再 看 一 下 这 里 的 各 项 . 因 
为 我 们 想 降低 多 项 式 的 次 数 (容易 出 问题 的 地 方 ), 所 以 w 中 应 该 包含 因子 w. 因子 
exp( 一 w2/2) 应 该 包含 在 dv 中 , 但 是 由 于 要 对 dv 求 积分 , 它 还 应 该 包含 因子 w. 这 
种 做 法 可 以 让 我 们 得 到 一 个 更 好 的 函数 , 其 原 函 数 能 用 解析 表达 式 来 描述 . 


I 


于 是 , 令 
u = ww, dv = exp(—w?/2)wdw, 
du = dw, v= -exp( 一 02/2). 
我 们 得 到 了 


全 让 oa 


=02 [ee 举 ee 0 el 二 二 


oo 
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最 后 一 行 涉及 很 多 内 容 . 首先 , 这 个 积分 就 是 1. 这 是 在 证 明 概 率 密 度 函 数 的 合理 性 
( 即 积 分 值 为 1) 时 见 到 的 积分 . 其 次 , 指数 函数 衰减 得 非常 快 , 以 至 于 当 w 一 士 co 
时 wexp(—w?2/2) 一 0. 
我 们 可 以 从 多 个 角度 来 考察 这 个 极限 . 这 个 式 子 可 以 写成 w/exp(w?/2). 然后 
回忆 一 下 , 当 t 取 正 数 时 , 我 们 有 exp(t) > 1+t. 这 个 不 等 式 之 所 以 成 立 , 是 因为 我 
们 只 是 截断 了 指数 函数 的 级 数 展开 式 . 这 样 就 得 到 了 w/exp(w?/2) < w/(1+w2/2)， 
而 w/(1 十 w2/2) 显然 会 趋 近 于 0. 另外 , 我 们 还 可 以 利用 洛 必 达 法 则 : 如 果 f 和 
9 都 是 连续 可 微 的 函数 , 并 且 limz ze f(z) = limz -oog(z) 都 等 于 0 或 co, 那么 
limn jz/o(z) = lims_yzo 了 (2)/9'(x). 对 于 上 述 极限 , 我 们 有 
lim 一 一 = lim 人 
uw 一 co exp(w2/2) uw 一 co Wexp(w?2/2) 
上 面 的 计算 突出 了 很 多 易 犯 的 错误 . 我 们 很 容易 把 积分 限 搞 错 , 或 者 错过 一 种 巧妙 
的 变量 奉 换 . 你 了 解 的 微 积分 知识 越 多 , 这 些 问 题 就 越 容易 解决 . 


uu 


二 0. 


14.3 ”服从 正 态 分 布 的 随机 变量 之 和 
很 遗憾 , 大 多 数 时 候 , 我 们 希望 能 够 成 立 的 定理 往往 是 错 的 ， 例 如 , 如 果 乘 积 


14.3 服从 正 态 分 布 的 随机 变量 之 和 


387 


的 导数 就 是 导数 的 乘积 , 或 者 商 的 导数 六 
当然 , 遗憾 的 是 , 这 两 种 情况 都 不 成 立 . 

的 最 好 结果 是 什么 ? 假如 , X 和 了 是 具有 相同 形状 的 
不 同 . 不 妨 设 它们 都 服从 某 种 理想 的 分 布 ， 


在 概率 论 中 ， 
独立 随机 变量 ， 


>、 


才 是 合理 


的 ?我 


我 们 想 要 
晶 它 们 的 均值 和 方差 可 外 
日 均值 分 别 为 yx 和 jy, 方差 分 别 为 oX% 和 o. 当 考 察 怀 十 和 
门 知道 , 和 的 均值 就 是 均值 
是 方差 的 和 . 因此 , 不 管 怎 术 


和 和 二 的 均值 


i 是 导数 的 商 , 那么 求 导 就 会 变 得 非常 容易 


时 ,什么 样 的 结果 


的 和 . 对 于 独立 的 随机 变量 , 和 的 方差 就 
定 是 HxX+Y 二 Hx 下 HAY， 方差 一 定 是 


ojy = 0% 十 o%. 如 果 和 +Y 的 形状 与 X 和 YY 的 形状 相同 , 那 不 是 很 好 吗 ? 这 


样 的 分 布 称 为 稳定 分 布 . 


我 们 知道 , 服从 均匀 分 布 的 随机 变量 之 和 并 不 是 服从 均匀 分 布 的 , 服从 指数 分 


布 的 随机 变量 之 和 也 不 服从 指数 分 布 . 但 
量 之 和 , 那么 我 们 会 非常 幸运 一 这 个 和 仍然 服从 正 态 分 布 . 


是 , 如 果 考 察 的 是 服从 正 态 分 布 的 随机 变 


相互 独立 的 随机 变量 , 并 


方差 分 别 是 o% 和 oz), 忆 


和 服从 均值 为 HLX Hy 


么 


服从 正 态 分 布 的 随机 变量 之 和 : 如 果 和 ~ N(jx,o%) 和 了 ~ Nur,oz) 是 两 个 
昌都 服从 正 态 分 布 (X 和 YY 的 均值 分 别 是 jx 和 jy， 
B+Y ~ Nnx+hy,o%1 
方差 为 cx 十 oz 的 正 态 分 布 . 


更 一 般 地 说 , 如 果 X; ~ Nu o2) 是 相互 独立 


XI1 十 …: 十 X 和 ~ TV 二 十 Ha 十 …， 


Foy). 也 就 是 说 , 它们 的 
都 服从 正 态 分 布 的 随机 变量 , 那 


十 On 


). 


如 果 你 还 没有 爱 上 正 态 分 布 , 那么 这 里 还 有 一 个 理 | 
匀 分 布 的 随机 变量 , 计算 和 的 概率 密度 函数 简直 是 场 上 


简单 就 好 了 ! 


! 回想 一 下 , 对 于 服从 均 
攻 梦 . 要 是 所 有 的 分 布 都 这 么 


这 个 结果 有 很 多 证 明 方法 . 我 们 会 采用 最 直接 的 方法 来 解 题 , 即 直 接 求 出 X+Y 


的 概率 密度 函数 . 事实 上 , 如 果 能 求 出 两 个 随 书 
用 数学 归纳 法 , 我 们 可 以 求 


8 人 有 


发 现 很 多 步骤 都 是 不 必要 的 ! 
两 个 相互 独立 且 都 服从 正 态 分 布 的 随机 变量 之 和 的 公式 推导 : 和 往常 一 样 , 我 们 利 
用 卷 积 理论 来 求 X 十 Y 的 概率 密度 函数 . 设 fx 是 X 的 概率 密度 函数 , fy 是 工 


的 概率 密度 函数 ， 


xz) 


fy(y) 


xy 是 十 Y 的 概率 密度 函数 . 于 是 


1 
V 270x 


exp(—(z — Hx) /20X) 


= exp(~(y ~ py)?/203) 


270y 


变量 之 和 的 概率 密度 函数 , 那么 利 
FE 意 和 的 结果 . 在 完成 计算 之 后 回 过 头 来 看 一 下 , 会 


fx+Y(2) Se fx(t)fy(z— tdt. 


现在 , 我 们 “跟着 直觉 走 ” 一 一 代入 两 个 概率 密度 函数 , 并 通过 一 些 代 数 运算 来 确 
保 最 终 得 到 一 个 容易 计算 的 积分 . 那么 


fxiy(2) = = exp(—(t— px)?/20%) 
XxX 


1 
; = exp(—(2—t— py)*/202)dt 
V2noy 
59 党 _ 本 
1 1 ep( 让 一 AX) ay 十 (一 二 一 /7) ja 


一 2Taxay 3 


现在 , 我 们 很 自然 地 想到 两 种 处 理 方法 . 第 一 种 方法 是 继续 对 积分 求 值 . 这 类 
积分 的 问题 在 于 , 题目 中 会 浮现 出 很 多 不 同 的 参数 , 让 人 感到 月 惧 . 我 希望 你 能 熟 
悉 这 种 计算 方法 , 所 以 现在 来 花 点 时 间 好 好 想 想 该 如 何 继续 . 

经 常 带 给 我 们 启发 的 解 题 方法 是 先 考 虑 一 种 特殊 情形 . 当然 , 最 简单 的 情形 就 
是 jx = hy =0 且 o% =o% =1. 在 这 种 情况 下 很 多 字符 都 消失 了 . 通过 考察 这 
种 情形 , 我 们 希望 弄 清楚 该 如 何 处 理 一 般 情况 . 


14.3.1 情形 1: jx= jy=0 且 o%=o%=1 


此 时 有 
ce 2 (> 有 2 
fx+Yr(z) = 去 人 exp (一 人) dt. 


最 目 然 的 做 法 是 把 式 子 都 展开 , 然后 得 到 一 个 关于 t 的 多 项 式 . 因为 


如 十 (Zz 一 可 ?= 好 十 如 一 2 十 必 
=2t2 — 2zt + 22, 


的 
Jx+y(z) = ) = 去 / = p(- 一 一 一 | dt. 


是 时 候 进行 变量 替换 了 . 这 是 代数 运算 中 最 难 的 一 步 , 因为 要 通过 添加 0 来 得 到 完 
全 平方 项 . 添加 0 是 数学 中 最 重要 的 方法 之 一 , 但 想 真 正 地 精通 茶 种 技巧 需要 花费 
很 长 时 间 ! 这 里 的 想法 是 , 在 添加 0 之 后 , 表达 式 的 值 并 没有 改变 , 但 代数 运算 可 
能 进一步 简化 (而 且 改写 代数 表达 式 可 以 让 分 析 变 得 更 容易 ). 于 是 有 


所 以 有 
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2 


Le- 


=) we 
一 2 (一 - os 2 

> ) 3 
(0) = a 

2 2 
-2) + i 

2 2 


把 这 个 结果 代 回 积分 式 中 , 可 得 


这 个 积分 提醒 我 们 进行 变量 替换 . 如 果 令 = 上 =- 弛 那么 上 式 就 简化 成 了 


22 
fx+Y(?) = 元 exp (4)/ exp(—w?)du. 


笠 运 的 是 , 本 章 前 面 已 经 计算 了 这 个 v 积分 ! 当 证 明正 态 分 布 的 概率 密度 函数 
积分 值 为 1 时 , 我 们 给 出 了 
we exp ( 一 由 2/202) dz = 1, 
这 个 函数 就 是 均值 为 4 且 方 差 为 o? 的 正 态 分 布 的 概率 密度 函数 . 整理 后 可 得 
[ro( 人) = V2no? (14.1) 
因此 , 上 述 w 积分 就 是 VA. 把 这 个 结果 代入 原 式 , 则 有 
2 
fx+Y(z) = exp (-) “VT 
1 2 
2 exp (-) 
注意 , 这 看 起 来 像 个 奇怪 的 正 态 分布 . 为 了 看 出 正 态 分 布 的 均值 和 方差 , 回忆 一 下 ， 


旧 数 部 分 应 该 是 -(z 一 4)?/2o?. 因此 , 这 意味 着 我 们 得 到 了 1 个 均值 为 0 且 方 差 为 
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2 的 正 态 分 布 . 如 果真 是 这 样 , 那么 外 侧 的 标准 化 第 数 应 该 是 1/V2r .2 = 1/2VT， 
这 恰好 与 上 式 一 致 ! 于 是 , 我 们 把 结果 写成 一 种 更 具 启 发 性 的 形式 , 这 样 就 证 明了 


Pa 1 ( (z— 
2 ， yp 
换 名 话说 , 对 于 两 个 相互 独立 的 随机 变量 , 如 果 它 们 都 服从 均值 为 0 旦 方差 为 1 的 
正 态 分 布 , 那么 它们 的 和 就 服从 均值 为 0 且 方 差 为 1 十 1=2 的 正 态 分 布 . 
当 我 们 做 代数 运算 时 , 如 果 计 算 过 程 超过 了 一 页 , 那么 就 有 必要 停 下 来 思考 一 
下 之 前 都 做 了 什么 . 这 里 的 关键 思路 是 , 我 们 已 经 证 明了 函数 


就 是 一 个 概率 密度 函数 , 所 以 它 的 积分 值 等 于 1 我 们 有 
人 OC 


这 给 出 了 一 个 与 t 的 二 次 方程 有 关 的 积分 , 而 这 个 方程 的 系数 最 多 是 > 的 二 次 式 . 
通过 完成 平方 , 我 们 得 到 了 一 个 形 如 2(t 一 z/2)? 十 有 /2 的 二 次 方程 . 在 进行 变量 替 
换 w=t 一 z/2 后 , 指数 部 分 就 变 成 了 w+ 22/4. 这 里 所 做 的 一 切 就 是 为 了 把 变量 
u 和 z 分 离开 来 . 我 们 可 以 把 变量 z 从 积分 中 提取 出 来 , 而 wv 积分 就 是 个 与 z 无 
关 的 常数 . 由 于 提取 出 的 是 z 的 二 次 式 的 指数 表达 式 , 高 斯 分 布 开始 出 现 了 ! 接 下 
来 要 做 的 就 是 找 出 与 z 有 关 的 部 分 . 在 积分 之 后 , 剩 下 的 部 分 就 变 成 了 一 个 常数 . 

这 里 还 有 另 一 种 解释 . 为 了 得 到 标准 化 常数 , 标准 化 常数 理论 利用 了 概率 密度 
函数 的 积分 值 为 1 这 一 事实 . 这 意味 着 , 如 果 我 们 有 一 个 概率 密度 函数 , 它 对 变量 
的 依赖 性 与 某 个 已 知 概率 密度 函数 对 变量 的 依赖 性 相同 , 那么 可 以 在 不 求 积分 的 情 
况 下 找 出 标准 化 常数 ! 特别 是 , 我 们 回顾 一 下 式 (14.1). v 积分 等 于 某 个 常数 , 不 妨 
记 作 C, 这 样 就 得 到 了 


C _,2 
fxiy(z) = DT 人 


因为 fx4y 是 一 个 概率 密度 函数 , 所 以 它 的 积分 一 定 等 于 1. 看 看 上 式 指数 部 分 
的 因子 , 我 们 发 现 它 可 以 写成 egp(-(z - 0)2/2 .2). 因此 , 一 定 可 以 得 到 一 个 均值 
为 0 且 方 差 为 2 的 正 态 分 布 , 并 且 C = VE (因为 这 个 高 斯 分 布 的 标准 化 常数 是 
1/vV2n.2). 
14.3.2 ”情形 2: 一 般 化 的 jx、ky 和 co 入 、a3 

一 般 情形 可 以 按照 类 似 的 方法 来 推导 , 唯一 的 不 同 是 代数 运算 会 更 烦琐 , 因为 
现在 会 涉及 更 多 的 符号 . 但 是 , 基本 思路 都 是 一 样 的 . 下 面 是 一 个 很 好 的 练习 , 通过 


一 
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修改 代数 运算 来 得 到 这 个 情形 的 结果 . 当 计 算 均 值 和 方差 时 , 最 简单 的 方法 是 在 积 
分 中 做 变量 蔡 换 . 

n 个 相互 独立 且 均 服从 正 态 分 布 的 随机 变量 之 和 的 公式 推导 : 对 于 一 般 情 形 ， 
首先 想到 的 是 利用 归纳 法 . 如 果 你 愿意 , 也 可 以 通过 使 用 大 量 括号 来 分 组 (分 组 证 
明 法 ). 这 是 另 一 种 常用 的 数学 方法 , 如 果 你 知道 某 结 论 对 两 个 对 象 成 立 , 就 可 以 把 
该 结论 推广 到 任意 有 限 多 项 . 对 该 方法 的 讨论 , 请 参阅 A.3 市 . 

如 何 利用 这 种 方法 来 得 到 独立 随机 变量 之 和 的 公式 呢 ? 从 本 质 上 看 , 我 们 就 是 
在 模仿 之 前 的 过 程 . 关键 的 信息 是 , 如 果 XX ~ N(jx,o%) 且 Y~N(1y,0o3), 那么 
十 YY~N(4x 十 MY,0% 十 呈 ). 用 符号 来 简单 地 描述 , 可 以 写成 


N(ux,o%) 十 N(uy,o¥) 一 NULX 十 Ha% 十 03) 


因为 
XI1 十 X2 十 Xa = 二 (XI 十 X2) 十 Xa3， 


所 以 有 


N(p101) + N(12,02) + N(13,03) = [N(p1,01) + N(12,02)| + N(13,03) 


M1+ KH2,0T +02) + N(13,03) 


2 2 2 
HI 十 Ha 十 Ha, al 十 02 十 03). 


如 果 随 机 变量 超过 三 个 , 那么 只 需要 重复 这 个 过 程 即 可 . 例如 , 当 n= 4 时 , 可 以 按 
照 下 列 方式 分 组 


(((X1 + X2) + Xs) + Xa4). 


两 个 相互 独立 且 均 服从 正 态 分 布 的 随机 变量 之 和 非常 重要 , 所 以 我 们 再 给 出 

种 论述 来 确定 这 个 和 的 概率 密度 函数 . 同样 地 , 为 了 简单 起 见 , 不 妨 设 X 和 了 是 
两 个 相互 独立 的 随机 变量 , 它们 都 服从 均值 为 0 且 方 差 为 1 的 正 态 分 布 . 这 种 方法 
要 利用 一 些 有 预见 性 的 灵感 . 这 是 证 明 数 学 命题 的 一 种 好 方法 , 但 有 个 缺点 , 就 是 
要 求 你 事先 知道 答案 或 者 能 够 预测 答案 . 这 也 是 有 一 定 道理 的 . 我 们 知道 X+Y 的 
均值 是 0, 方差 是 2 也 许 我 们 做 了 一 些 数 值 实验 , 图 形 看 起 来 就 是 一 个 正 态 分 布 . 
唯一 可 能 的 正 态 分 布 是 N(0,2), 不 妨 来 试 一 试 . 换 名 话说 , 如 果 让 fx+y(z) 除 以 均 
值 为 0 且 方 差 为 2 的 正 态 分 布 的 概率 密度 函数 , 那么 应 该 得 到 1. 现在 用 


fo,2(z) exp( 一 22/2 2) 


1 
V 玩 
来 表示 这 个 正 态 分 布 ( 即 均值 为 0 且 方差 为 2 的 正 态 分 布 ) 的 概率 密度 函数 . 接 下 
来 , 开始 进行 代数 运算 ! 于 是 有 


外 


©O 


我 们 想 要 一 个 能 求 值 的 积分 . 所 以 , 现在 配 完全 平方 项 (对 上 的 二 次 式 ), 这 会 把 上 
面 的 积分 转化 成 我 们 熟悉 的 积分 . 于 是 得 到 了 


fxiy(2) 1 人 em 人 4(t2— zt 2 22/4) + 一 jd 


=- 专 / ep 人 一) 


站 exp (- ( 一 3 ) dt. 

我 们 可 以 利用 式 (14.1) 来 求 上 述 积分 , 它 给 出 了 二 次 式 的 指数 函数 的 积分 值 . 对 我 
们 来 说 , 被 积 函 数 看 起 来 像 一 个 均值 为 /= z/2 且 方 差 为 o? = 1/2 的 正 态 分 布 的 
概率 密度 函数 , 因此 上 面 的 积分 就 等 于 V2rc2 = V27/2 = Vx. 把 这 个 结果 代入 上 
式 就 得 到 了 


fo,2(z) VT 
也 就 是 
32 
ftr(s) = ja 人 = 
X+Y(Z 0,2 和 en 人 ( 2 
这 正 是 我 们 想 要 证 明 的 ! 


显然 , 这 里 的 代数 运算 与 第 一 种 方法 有 很 多 相似 之 处 . 不 同 之 处 在 于 , 我 们 试 
直觉 来 判断 答案 应 该 是 什么 , 进而 引导 我 们 进行 代数 运算 . 数学 中 最 难 的 部 分 
是 学 会 代数 运算 的 正确 方法 . 如 果 能 找到 正确 的 视角 , 你 就 能 看 到 其 中 有 意思 的 关 
联 . 


闷 
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14.3.3 ”两 个 服从 正 态 分 布 的 随机 变量 之 和 : 更 快 的 代数 运算 


再 来 看 看 两 个 服从 正 态 分 布 的 随机 变量 之 和 . 这 是 个 经 常 出 现 的 问题 , 而 我 们 
能 找到 男 一 种 不 用 求 积 分 就 能 得 到 积分 值 的 方法 . 有 种 很 标的 技巧 需要 掌握 : 通常 
情况 下 , 如 果 能 接近 正确 答案 , 就 可 以 通过 调整 所 做 的 工作 来 得 到 精确 结 果 , 这 要 
比 直 接 求 解 轻 松 很 多 . 这 种 方法 叫 作 纠正 猜想 

回想 一 下 , 如 果 和 ~ N(0,o2.) 和 YY ~ N(0,0%) 是 两 个 相互 独立 上 且 均 服从 高 
斯 分 布 的 随机 变量 , 并 且 Z = X +Y, 那么 2 的 PDF, 即 fz(z) 就 满足 


和 1 —t2/20% 1 —(z—t)?2/202 
人 V2maoy- V2may- ° 
另外 , 因为 X 和 了 相互 独立 , 所 以 2 的 均值 一 定 是 0, 方差 一 定 是 o 十 o. 因此 ， 
如 果 2 服从 正 态 分 布 , 那么 它 只 能 服从 正 态 分 布 N(0,o% 十 o%). 现在 , 我 们 集中 
精力 证 明 2 服从 正 态 分 布 , 因为 一 旦 证 明了 这 一 点 , 所 有 常数 都 能 马上 确定 下 来 ! 
注意 , 在 fz(z) 中 , 指数 位 置 的 表达 式 是 


t= 
去 20% 9 
可 以 展开 上 式 并 对 其 进行 简化 . 一 定 存在 某 些 与 ox 和 oy 有 关 的 常数 , 使 得 指数 
位 置 的 表达 式 等 于 


一 022 一 站 一 cz)2. 


想得到 上 式 这 样 的 结果 , 要 通过 添加 0 来 得 到 关于 上 的 完全 平方 项 , 然后 把 剩 下 
人 2 部 分 补充 完整 . 具体 地 说 , -at? - B(z 一 力 2 就 等 于 


2 | 2 2 2 bz 6 bz 
Dee SE Qa+p (二) (有 5) 
这 有 什么 用 呢 ? 我 们 看 到 


SR 1 
fz(z) = / -a eblt-e2) dt. 
/二 


__%w 2Taxaoy 


= -一 0 和 2 一 0 一 ca 


做 变量 替换 , 令 v=t- cz. 把 exp(-az2) 从 积分 中 提出 来 就 得 到 了 


2 1 2 2 2 
fz(2) = e zw/ en a = Ce "*, 


2TOXOyY 


其 中 C 是 一 个 与 cx 和 oy 有 关 的 常数 . 


现在 奇迹 发 生 了 . 注意 , 上 面 的 概率 密度 函数 就 是 均值 为 0 且 方 差 为 支 的 高 


斯 分 布 的 概率 密度 函数 , 因为 


粒 
Cexp(—az’) = Cexp 二 人 
3a 


由 于 2 的 方差 是 oz = coX 十 og, 因此 一 定 有 a = zcoz+ag) 为 外 , 因为 我 们 有 一 个 


均值 为 0 且 方 差 为 1 的 高 斯 分 布 , 所 以 标准 化 常数 ， 定 总 1/V2rc2y. 于 是 有 


1 2 2 2 
fz(z) = ee exp ( 7X“ /2(ox 十 o¥)) . 


有 必要 回顾 一 下 这 种 方法 . 第 一 次 求解 这 个 问题 时 , 我 们 做 了 所 有 的 代数 运算 . 


事实 上 , 在 配 完全 平方 项 时 , 我 们 没 必要 知道 系数 是 什么 , 只 需要 明白 这 里 有 一 些 


系数 即 可 . 当 侍 埃 落 定之 后 , 由 于 我 们 知道 2 的 均值 和 方差 , 能 马上 对 近似 做 出 人 


正 ! 
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多 


陶 


蜂 然 本 节 的 标题 是 生成 随机 数 , 但 我 们 会 做 更 多 事情 . 下 面 将 学 习 妇 
数 展开 来 近似 概率 . 级 数 展开 可 以 用 于 很 多 方面 , 比如 计算 事件 的 可 能 
定 分 布 中 生成 随机 数 . 


上 何 通过 级 


性 以 及 从 给 


此 处 的 目标 是 从 标准 正 态 分 布 中 生成 一 些 数 .我 们 已 经 有 了 一 个 随机 数 生成 
器 , 它 会 从 [0,1] 中 均匀 地 选择 数 . 我 们 想 利 用 累积 分 布 函数 法 . 当 讨 论 均匀 分 布 和 


此 数 分 布 时 , 这 种 方法 发 挥 了 很 好 的 效果 , 所 以 为 什么 不 在 这 里 使 用 呢 ? 


遗憾 的 是 ， 


累积 分 布 函 数 法 很 难 应 用 于 正 态 分 布 . 这 似乎 不 太公 平 , 因为 累积 分 布 函 


数 法 是 种 


很 好 的 方法 , 而 正 态 分 布 是 最 重要 的 分 布 之 一 . 哪里 出 问题 了 ? 这 个 问题 可 以 追 洲 


到 微 积分 I (微分 ) 和 微 积 分 I (积分 ) 之 间 的 斗争 . 不 管 你 的 教授 多 么 昌 


恶 , 他 都 


不 可 能 出 一 道 超 出 你 能 力 范围 的 微分 问题 . 例如 , 想象 一 下 , 你 需要 计算 下 面 这 个 


g(x) = (log (eos (x? 十 1) exp (z 十 Vennz))) | 


尽管 这 个 函数 看 起 来 很 下 人 , 但 是 可 以 通过 重复 利用 微分 法 则 来 求 导 


开 且 我 们 知 


道 所 有 初等 函数 的 导数 . 对 于 这 个 问题 , 可 以 把 g(z) 写成 


g(x) = (A(z))?, A(z) = log (eos (z2 + 1) exp (z+ Vinz)). 


这 一 点 也 不 难 , 只 要 使 用 窜 函 数 求 导 法 则 就 行 了 , 于 是 有 


g(r) = 2A(x)A’'(z). 
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现在 该 计算 4'(z) 了 . 可 以 这 样 写 


4(z) = log B(x), B(x) = cos (2 十 1 exp 加 十 VSin 


由 链 式 法 则 可 得 


关键 在 于 , 上 只 要 有 耐心 (同时 也 要 非常 小 心 ), 我 们 总 会 得 到 答案 . 每 个 步骤 都 会 降 
低 问 题 的 复杂 性 , 最 终 我 们 将 不 需要 对 函数 求 微分 . 耐心 总 会 得 到 回报 ! 整个 计算 
过 程 可 能 并 不 是 特别 轻松 , 但 我 们 很 清楚 该 如 何 进行 下 去 . 
积分 要 困难 得 多 . 虽然 可 以 使 用 积分 法 则 , 但 这 是 个 完全 不 同 的 问题 . 微分 可 
以 被 看 作 一 个 非常 机 械 的 过 程 . 检查 一 下 目标 函数 是 不 是 两 个 函数 的 和 . 如 果 是 ， 
那 就 使 用 和 的 求 导 法 则 . 如 果 不 是 , 则 看 它 是 不 是 两 个 函数 的 差 、 乘积 , 或 者 一 个 复 
合 函 数 . 你 应 该 明白 了 . 我 们 可 以 有 条 不 紊 地 一 步 步 验证 , 最 终 一 定 会 得 到 正确 答 
案 . 对 于 积分 , 并 没有 一 套 必定 可 行 的 方法 . 事实 上 , 大 部 分 函数 的 积分 都 没有 合适 
的 闭合 型 结果 . 有 时 , 某 些 函数 确实 有 很 好 的 积分 表达 式 , 但 我 们 要 使 用 一 些 技巧 
或 具有 一 定 的 洞察 力 才 能 看 到 . 例如 , 如 果 f(x) = logz, 那么 F(z) = zlogz 一 z 是 
f(z) 的 原 函 数 . 虽然 很 难 找到 所 (z), 但 验证 它 却 不 难 . (作为 一 个 有 趣 的 练习 , 求 出 
jz) = z51log2 2 的 一 个 “不 错 的 ” 原 函 数 .) 尽管 如 此 , 对 于 f(z) = sinz:logz 的 积 
分 , 我 们 找 不 到 一 个 很 好 的 表达 式 . 
你 大 概 可 以 猜 到 接 下 来 要 说 什么 : 对 于 正 态 分 布 , 其 概率 密度 函数 的 积分 没有 
一 个 很 好 的 表达 式 . 这 意味 着 我 们 没有 很 好 的 累积 分 布 函数 公式 . 如 果 想 利用 累积 
分 布 函数 法 从 正 态 分 布 中 生成 随机 数 , 那么 这 无 疑 是 巨大 的 打击 . 
现在 该 怎么 做 呢 ? 我 们 不 得 不 借助 逼近 . 一 种 方法 是 对 正 态 分 布 的 概率 密度 函 
数 进行 数值 积分 , 并 用 它 来 近似 累积 分 布 函 数 . 虽然 这 并 不 精确 , 但 如 果 选 择 足 够 
小 的 步 长 , 那么 就 可 以 使 误差 任意 小 ， 如 果 你 还 记得 微 积分 I 中 像 辛普森 法 则 这 
样 的 方法 , 那么 现在 就 是 使 用 它们 的 好 时 机 ! 
另 一 种 可 能 的 方法 是 试 着 对 累积 分 布 函数 进行 数值 逼近 . 如 果 用 $ 表示 标准 
正 态 分 布 的 概率 密度 函数 , 那么 它 的 累积 分 布 函数 就 是 


SS 


D(z) = 人 站 bbdy = 人 高 et /2dt. 


这 个 积分 怎么 可 能 求 得 出 来 呢 ! 好 吧 , 我 们 来 思考 一 下 . 最 自然 地 想到 什么 ? 我 们 
知道 指数 函数 的 级 数 展开 式 . 现在 就 把 它 代 进去 , 看 看 能 得 到 了 什么 . 不 要 担心 收 
敛 问 题 , 也 不 用 担心 交换 运算 次 序 的 问题 . 我 们 不 做 严格 的 数学 论证 , 只 是 简单 地 
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看 看 会 发 生 什么 , 并 试 着 揭示 这 个 函数 B(x) 是 什么 样 的 . 于 是 
1 /ll EN 
so -Di) 
i (lj fe 
= J Vi 
我 们 无 路 可 走 了 , 现在 没有 办 法 继续 进行 下 去 . 为 什么 ? 即使 能 够 证 明 积 分 与 求 和 
的 运算 次 序 是 可 以 交换 的 (这 通常 是 件 好 事 ), 最 终 仍 会 得 到 一 个 可 怕 的 积分 . 问题 
在 于 , t2? 在 -co 到 x 上 的 积分 始终 是 无 穷 大 的 , 所 以 我 们 的 表达 式 就 会 变 成 正 无 
穷 大 和 负 无 穷 大 的 交替 和 . 你 应 该 听 说 过 , 有 几 种 表达 式 是 必须 避免 的 , 永远 不 要 
处 理 它们 . 对 于 ce - co, co .0 和 oo0/ow, 不 要 试图 为 它们 下 定义 . 
我 们 似乎 注定 要 为 8(t) 寻找 一 个 好 的 级 数 展开 式 . 但 是 , 不 要 绝望 .正如 你 
所 看 到 的 , 记 住 我 们 求 的 是 从 -co 到 x 上 的 积分 .计算 x 处 的 积分 值 是 没有 问 
题 的 , 关键 在 于 -co. 有 种 方法 可 以 得 到 一 个 非常 好 的 旦 容易 处 理 的 表达 式 . 它 要 
利用 问题 中 的 一 些 对 称 性 . 利用 对 称 性 是 解决 各 种 环 手 问题 的 有 效 方法 , 更 多 相关 
讨论 请 参阅 A.4 节 . 我 们 把 与 8(z) 有 关 的 信息 记录 下 来 : limy_,_w B(xz) = 0 和 
lims_,wo B®(z) = 1. 这 并 没有 提供 太 多 信息 , 所 有 累积 分 布 函数 都 是 如 此 . 幸运 的 是 ， 


还 有 两 个 非常 有 用 的 事实 . 第 一 个 是 


亚 (0) = 1/2. 


这 就 意味 着 0 之 前 的 概率 占 了 一 半 , 而 另 一 半 概 率 则 出 现在 0 之 后 . 这 个 式 子 成 立 
的 原因 是 , 概率 密度 函数 p(t) 是 一 个 关于 0 对 称 的 偶 函 数 . 因此 , 一 半 的 概率 落 在 
0 之 前 , 一 半 概 率 落 在 0 之 后 . 
很 幸运 , 我 们 还 能 得 到 更 多 结果 . 因为 概率 密度 函数 $(t) 关于 0 对 称 , 所 以 对 
于 任意 一 个 固定 的 正 数 x, 我 们 一 定 能 够 求 出 / 9(t)dt， 如 果真 能 做 到 这 一 点 , 那 
么 对 于 任意 给 定 的 zx, 都 能 轻松 地 求 出 B(x)! 

该 怎么 做 呢 ? 有 两 种 情况 . 首先 , 假设 我 们 的 输入 是 非 负 的 , 所 以 > > 0. 于 是 


TB(7) p(t)dt 


= 人 (bdt 十 [ l p(t)dt 
十 P(t)dt. 


因此 , 在 这 种 情况 下 , 上 述说 法 是 可 行 的 . 
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如 果 输 入 是 负数 呢 ? 我 们 把 这 个 负数 记 作 -z, 其 中 x > 0. 于 是 有 


这 表明 了 , 只 要 可 以 求 出 > 取 正 数 时 的 9( 


t)dt, 就 能 求 出 任何 输入 下 的 &. 


这 有 什么 好 处 呢 ? 利用 这 个 结果 , 我 们 可 以 使 用 级 数 展开 , 而 不 必 计 算 无 穷 区 间 上 
的 积分 .在 处 理 无 穷 大 时 , 我 们 一 定 要 非常 小 心 __ 如 果 能 避免 无 穷 大 , 那 就 更 好 
了 ! 现在 我 们 会 找到 一 个 很 好 的 级 数 展开 式 . 再 次 说 明 , 能 做 到 这 一 点 是 因为 概率 
密度 函数 有 大 量 对 称 性 可 供 利用 . 现在 来 看 一 下 具体 细节 . 设 x > 0. 那么 有 
B(x) = 小 p(t)dt 
0 rz 
三 d 
a oDat+ 4(b)dt 
ee 
二 [ 二 dt 
1 1 5 t2\” 
-53+- 启 上 > 
a 
= 了 二 | | t27dt. 


0 会 受到 因子 
的 . 具体 地 说 , 我 们 有 


如 果 x 宕 0, 那么 B(x 


地 , 我 们 有 


i 我 们 求 的 是 简单 函数 t2" 在 有 限 区 间 上 的 积分 . 虽然 这 些 积分 值 
1/2™nl 的 影响 , 而 1/2"ml! 会 迅速 衰减 , 这 


会 不 断 增 长 ， 
就 保证 了 和 是 收敛 


Ooe 并 727+1 
14.2 
二 27 十 1 4 | 
1 I 1 OO )”™ 727+1 
二 一 t)dt = 14.3 
$0) 2 2 27 十 1 ( ) 
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看 这 利 


2 
0 ,et ed $at 


n 92n+1 


2r 4 2nn!l 2n++l1 


) 


2 记 (-1 
i 


n+1) 


这 里 让 式 (14.2) 减 去 了 式 (14.3). 取 展 开 式 的 前 5 项 可 得 


Prop(~2 < X <2) 


”VY 于 3° -5 2 


2 4 4 
[ee 


ed 呈 光 
97 > 


通过 计算 服从 标准 正 态 分 布 的 随机 变量 在 -2 和 2 之 间 取 值 的 概率 , 我 们 看 一 
FP 近似 有 多 好 . 也 就 是 说 ， 


0.984 48; 


答案 约 为 0.954 499 736.， 只 考虑 5 项 就 可 以 得 到 一 个 很 不 错 的 近似 值 ， 市 


子 太 大 , 所 以 当 把 它 除 以 2"m! 时 会 得 到 2?+1/n!(2n 填 1). 


者 的 大 小 是 相当 的 , 因此 前 几 


正 帮 

且 工 作 量 也 很 少 . 没有 得 到 更 好 的 近似 值 是 因为 , 在 求 积分 时 我 们 得 到 了 一 个 因子 
227+1/(2n 十 1). 因为 这 个 因 

虽然 n! 的 增长 速度 远 远大 于 2", 但 对 于 较 小 的 mw 两 

项 对 概率 有 着 显著 的 贡献 . 如 果 考 虑 10 项 的 话 , 近 


10 项 , 误差 就 


i 己 经 非常 小 了 , 约 为 0.000 018 361! 


以 值 就 是 0.954 481 375. 只 需要 


在 图 14-2 中 , 我 们 绘制 了 B(2) 一 B(--2) 的 一 些 级 数 近似 值 , 这 里 的 8(2) 一 B( 一 2) 


了 一 个 不 错 上 
的 近似 值 需要 多 少 项 . 这 是 可 以 实现 的 ， 
而 每 一 项 的 绝对 


值 都 会 比 前 一 : 


是 服从 标准 正 态 分 布 的 随机 变量 在 -2 和 2 之 间 取 值 的 概率 . 注意 , 我 们 很 快 得 到 
的 拟 合 . 多 做 一 点 工作 , 我 们 就 可 以 讨论 级 数 展 姑 


F 式 ， 并 看 看 想得到 好 


因为 我 们 的 级 数 展开 式 是 正 、 负 项 交替 的 ， 
硕 小 . 这 意味 着 , 如 果 在 一 个 正 项 处 截断 , 我 们 会 得 


到 级 数 的 上 界 ; 但 如 果 被 保留 的 最 后 一 项 是 负 的 , 那么 我 们 就 得 到 了 一 个 下 界 . 


虽然 我 们 没有 解决 最 初 的 问题 , 即 为 9(t) 的 积 


试 着 月 


好 ! 


台 已 4 目 


且 侍 


日 辛普森 法 由 
到 如 此 好 的 结果 
后 逐 项 积分 . 到 目前 为 上 上， 


但 只 要 多 花 点 功夫 , 就 可 以 得 至 


是 


我 们 的 答案 是 精确 的 ， 唯 
向 


分 找到 
I 任意 精度 的 积分 近似 值 , 而 且 通 
| 或 其 他 的 数值 逼近 来 做 同样 的 事情 , 你 会 发 现 利用 级 数 展开 式 
因为 , 我 们 可 以 将 这 个 被 积 函数 展 


个 简单 而 精确 的 公式 ， 


常 不 会 用 到 很 多 项 . 


成 一 个 无 限 和 , 然 


由 于 级 数 收敛 得 非常 快 , 这 点 误差 不 会 产生 太 大 影 1 


的 误差 


8 现在 做 截断 时 , 但 
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5 10 15 20 


图 14-2 GB(2) 一 更 (--2) 级 数 近似 的 收敛 , 其 中 更 (2) 一 8(--2) 表示 服从 标 ; 


E 正 态 分 布 的 随机 


变量 在 [2, 2] 上 取 值 的 概率 . 不 难看 出 , 只 需要 6 项 就 能 得 到 很 好 的 近似 


如 果 不 讨论 误差 冰 数 , 对 B 的 介绍 就 不 完整 . 通常 , 当 数 学 家 遇 到 一 个 无 法 求 
值 的 积分 时 , 他 们 就 会 为 该 积分 命名 . 这 并 不 表示 我 们 现在 可 以 求 出 积分 值 , 相反 ， 


这 意味 着 该 积分 出 现 得 非常 频繁 , 有 必要 为 它 取 个 名 字 . 几乎 可 以 肯定 的 是 , 已 经 
有 人 把 它 的 许多 值 制 成 了 表格 , 或 者 算出 了 它 的 级 数 展开 式 . 由 于 正 态 分 布 在 概率 


期 望 的 那样 . 它 被 称 为 误差 函数 , 并 记 为 Erf(z), 也 就 是 


2 2 
Erf(z) := 去 | edt. 


中 极为 重要 , 它 的 积分 被 命名 也 就 不 足 为 奇 了 . 遗憾 的 是 , 它 的 命名 方式 并 不 是 你 


很 遗憾 , 我 们 不 得 不 接受 这 个 符号 . 这 是 方差 为 1/2 的 正 态 分 布 的 概率 密度 函数 在 


0 到 xz 上 的 积分 . 虽然 方差 为 1 会 更 好 , 但 这 里 是 为 了 让 指数 位 置 


的 变量 具有 更 好 


的 形式 (是 -万 , 而 不 是 一 如 /2). 通过 做 一 些 代 数 运 算 和 变量 替换 ， 


数 展开 联系 起 来 . 现在 再 看 一 看 上 面 的 问题 , 即 求 出 服从 标准 正 态 分 布 的 随机 变量 


在 -2 和 2 之 间 取 值 的 概率 . 我 们 有 


Prop(-2 < X < 2) = (2) — B(—2) 


可 以 把 上 式 与 级 
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许 


如 果 把 从 -2 到 2 的 区 间 替 换 成 从 -z 到 zx, 那么 唯一 的 不 同 就 是 要 计算 z/V2 处 
的 函数 值 , 而 不 是 2/V2 = V2. 于 是 , 我 们 得 到 了 误差 函数 的 级 数 展开 式 ! 


如 果 B 是 标准 


E 态 分 布 的 累积 分 布 函数 , Erf(z) 是 误差 函数 , 那么 


1)"z nl 


saO-eCa = Ef ( 序 ) - ee 


14.5 ”例子 与 中 心 极 限定 理 


在 本 节 中 , 我 们 将 看 到 如 何 利 用 正 态 分 布 的 相关 结果 来 计算 概率 . 这 种 计算 方 
法 在 统计 学 中 非常 重要 , 你 会 在 第 22 章 中 再 次 看 到 这 部 分 内 容 . 

设 随机 变量 X 服从 =5 且 o? = 16 的 正 态 分 布 . 计算 (a) Prob(2 <X < 了 ) 
和 (b) Prob(X > 0). 

我 们 要 把 随机 变量 标准 化 . 这 意味 着 要 做 变量 蔡 换 , 并 把 计算 转化 到 均值 为 0 
且 方 差 为 1 的 标准 正 态 分 布 上 ， 这样 就 可 以 使 用 标准 正 态 分 布 数值 表 . 换 句 话说 ， 
只 要 知道 一 个 正 态 分 布 的 数值 表 , 我 们 就 能 处 理 所 有 的 正 态 分 布 . (更 多 相关 信息 ， 
请 参阅 关于 换 底 公式 的 20.8 节 或 习题 14.6.4、 习 题 20.11.23.) 

我 们 通过 令 X 一 4 来 进行 调整 , 并 让 2 表示 服从 标准 正 态 分 布 的 随机 变 


[Ne 


果 
加 | 


对 于 (a), 我 们 有 
2—5 X55 7—5 
Prop2 < X <7) = Prop( i i) 
中 1 
= Prop ( 字 <Z<3) 


= &(1/2) — B(-3/4) 


= (1/2)— (1-3) ~ 0.4649， 


而 对 于 (b), 我 们 有 


14.6 习 


题 401 


X 二 
Prob(X > 0) = Prob (2 
5 
一 Prob (z > -3) 
5 5 
i 
法 0.8944. 
你 可 能 已 经 注意 到 , 我 们 只 有 一 个 > 值 表 , 而 且 


的 正 态 分 布 随 机 变量 , 那么 令 X 一 前 


格 了 . 


因此 ， 


习题 14.6.1 


和 [1l,co). 把 函数 1 看 作 第 一 
么 , 把 e ”可 以 看 作 整 个 


习题 14.6.2 


我 们 把 包含 e-” ( 即 正 态 分 布 积分 的 边界 ) 


职 分 


只 需要 一 个 表格 就 可 以 处 理 所 有 的 正 态 分 布 . 
14.6 习 题 


的 积分 


已 


个 均值 为 A 且 


它 仅 适用 于 标准 正 态 分 布 . 与 
前 面 的 例子 一 样 , 任何 正 态 分 布 都 可 以 标准 化 . 如 果 有 


方差 为 


和 一 


二 个 积分 函数 的 上 界 . 那 


可 以 把 它 标准 化 , 这 样 就 能 使 


有 这 个 表 


区 域 划分 成 两 部 分 , 即 [0, 1] 
个 积分 函数 的 上 界 , 把 e-” 看 作 粤 
函数 的 上 界 吗 ? 为 什么 ? 


对 于 某 些 特定 的 参数 值 , 下 列 哪些 分 布 可 以 用 正 态 分 布 来 很 好 地 逼近 : 连续 均 


匀 分 布 、 指 数 分 布 、 爱 尔 衣 分 布 、 泊 松 分 布 、 几 何 分 布 、 二 项 分 布 、 负 二 项 分 布 ， 以 及 卡 


方 分 布 ? 
习题 14.6.3 


(互相 垂直 的 直线 乘积 ) 这 是 个 co .0 = 一 1 


互相 垂直 的 直 


区 
习题 14.6.4 


大 


那么 男 一 条 直线 的 斜率 就 等 于 一 1/m. 
下 , 当 两 条 直线 与 坐标 轴 平 行 四 
的 斜率 为 co. 所 以 , 在 这 种 情况 下 , 我 们 
标准 化 随机 变量 的 过 程 类 似 于 你 在 对 数 表 
为 现在 很 少 有 人 使 用 对 数 表 , 连 手机 都 可 以 计算 对 数 )， 在 “ 早 ” 年 间 , 有 专门 
算 对 数 的 查阅 表 (在 “更 早 ” 的 时 候 , 有些 人 的 了 


[ 线 . 假设 这 两 条 直线 都 不 


大 | 山 


的 有 趣 作 


1 子 . 考虑 两 条 穿 过 原点 且 


在 坐标 轴 上 , 证 明 : 如 
k, 这 两 条 直线 的 人 
路 它们 和 斜率 的 乘积 仍然 为 1， 

自然 会 说 co . 0 = 一 1. 


果 有 


条 


人 泵 - 


1 线 的 斜率 是 m， 


率 乘积 是 
比 时 xz 轴 


一 1. 在 极限 情况 
的 斜率 为 0, 而 y 


使 | 


FP 所 看 到 的 东西 (也 可 能 不 是 这 样 ， 
用 来 计 
[ 作 就 是 计算 这 些 对 数值 ). 创建 这 些 表 


log。z = 


格 需要 花费 大 量 时 i 
的 对 数值 , 就 能 求 出 
log, x/ log, c. ( 因 


为 底 的 对 


习题 14.6.5 


习题 14.6.6 ”考虑 标准 正 态 分 布 
用 f(x) 来 表示 . 
习题 14.6.7 ”对 于 标 


式 ; 


习题 14.6.8 


数 .) 请 证 明 该 公式 . 


击 


司 ,， 而 且 你 也 不 想 随 身 


以 任何 


上 ,如 


证 明 : 正 态 分 布 关于 直线 z 一 对 称 . 


携带 它 ， 幸 运 
个 数 为 基底 的 对 数 ! 这 是 


的 概率 密度 函数 , 即 f(z 


a 
) 二 


© 


的 是 ， 如 果 知 道 以 茶 个 数 为 基 


底 


2 


于 标准 1 


对 


E 态 分 布 , 求 出 其 概率 密度 函数 的 二 阶 导数 , 并 
于 参数 为 (1,o?) 的 正 态 分 布 , 求 出 它 的 所 有 奇数 阶 中 心 距 . 


因为 我 们 可 以 使 
果 能 求 出 以 为 底 的 对 数 , 就 可 以 轻松 地 求 出 以 任何 数 


| jz 


j 换 底 公 式 ， 即 


出 f(x) 的 表达 


) 来 表示 1”(z). 


402 第 14 章 连续 型 随机 变量 : 正 态 分 布 

习题 14.6.9 “对 于 参数 为 (1,o?) 的 正 态 分 布 , 求 出 它 的 所 有 偶数 阶 中 心 距 . 

习题 14.6.10 ”讨论 一 种 从 标准 正 态 分 布 中 生成 随机 数 的 方法 , 利用 独立 同 分 布 的 随机 变量 
之 和 趋 近 于 正 态 分 布 . 

习题 14.6.11 ”利用 泰勒 近似 来 估算 , 从 标准 正 态 分 布 中 选 出 的 随机 变量 落 入 与 均值 距离 为 
4 位 小 数 的 标 偏差 范围 内 的 概率 . 证 明 你 近似 的 精确 度 . 

习题 14.6.12 ”在 使 用 中 心 极限 定理 时 , 随机 变量 必须 是 相互 独立 的 吗 ? 请 给 出 解释 . 

习题 14.6.13 设 X 服 从 /=3 且 co2= 25 的 正 态 分 布 .通过 标准 化 来 计算 Prob(5 < X < 
7 

习题 14.6.14 ” 设 随机 变量 X 服从 正 态 分 布 , 且 满足 Prob(2 < X < 3) = 和 Prob(X < 
0) = 于 那么 人 和 o? 分 别 是 多 少 ? 

习题 14.6.15 ” 设 随 机 变量 X 服从 正 态 分 布 , 并 且 Prob(X < 1) = 于 那么 的 最 小 值 是 多 
少 ? 

习题 14.6.16 ” 当 入 取 何 值 时 , 与 泊 松 分 布 均值 的 距离 为 两 个 标准 差 的 范围 面积 是 与 正 态 分 
布 均值 的 距离 为 两 个 标准 差 的 范围 面积 的 1.3 倍 ? 

习题 14.6.17 ”必须 对 二 项 分 布施 加 哪些 约束 条 件 , 才能 使 得 与 其 均值 距离 为 一 个 标准 差 的 
范围 面积 等 于 与 正 态 分 布 均值 的 距离 为 一 个 标准 差 的 范围 面积 的 1.2 倍 ? 

习题 14.6.18 ”为 什么 测量 和 生产 中 的 误差 往往 被 认为 是 服从 正 态 分 布 的 ? 

习题 14.6.19 ” 设 X 和 了 是 相互 独立 的 随机 变量 , 且 都 服从 均值 为 0 且 方 差 为 1 的 正 态 分 


布 . 求 出 max(X 一 冯 立 一 X) 的 PDF. 
14.6.20 ” 设 X 是 一 个 服从 标准 
14.6.21 

正 态 分 布 . 
14.6.22 

门 的 联合 概率 密度 函数 . 
14.6.23 
门 像 往 常 那 术 
动 1 单位 距离 的 概率 都 等 于 1/2. 幸运 的 是 ， 
FE 常 小 . 请 解释 一 下 , 经 过 足够 长 的 时 间 


A 


时 间 都 


以 通过 下 


14.6.24 ”对 于 上 


证 明 : 对 于 两 个 放 


设 和 ~ N(a 


在 物 开 


E 态 分 布 模型 来 计算 ? 


E 化 学 中 , 人 们 通 


目 互 独立 


f) 和 Xs ~ N(j2,03) 相互 独立 且 都 有 


FE 态 分 布 的 随机 变量 . 求 出 X? 的 PDF. 
都 服从 正 态 分 布 的 随机 变量 ， 


它们 的 乘积 也 服从 


民 从 正 态 分 布 , 求 出 它 


常 需要 知道 粒子 所 在 的 


y 


置 . 现在 考虑 


维 的 情形 . 我 


始 


1 14.6.25 


口 


? 4 人 


的 飞镖 个 数 , 并 考察 这 些 飞镖 
区 域 与 矩形 区 域 面积 的 比 人 
曲线 一 个 标准 差 范 
积 14.6.26 


该 


的 概率 . 


想 是 


什么 ? 


题 中 描述 的 粒子 ,你 对 其 位 置 的 最 佳 猜想 是 
有 多 远 , 你 的 最 佳 猎 


于 粒子 运动 的 速度 非常 快 , 所 以 每 个 单 
后 , 粒子 在 某 个 特定 位 置 的 概率 为 


上 么 可 


十 么 ? 对 于 粒子 距离 初 


一 种 对 


区 域 面 积 ; 


“投掷 飞镖 ”, 更 确切 地 说 ， 


所 


En 


使 用 蒙 4 


SS 
2 


a 


行 数值 近似 . 
来 近似 从 标准 


y 


态 分 布 


行 数值 模拟 的 方法 是 将 该 区 域 放 


在 一 个 较 大 的 矩形 中 ， 


就 是 从 较 大 矩形 中 均匀 地 取 点 . 
5 的 百分比 , 那么 随 着 飞镖 数量 的 
直 . 这 种 技巧 称 为 蒙特 卡 罗 积 分 ， 利 
围 内 的 面积 


下 罗 积分 


FP 取出 的 随机 变量 


区 域 
改 敛 到 
分 对 正 态 


如 果 你 留意 落 在 该 
增加 , 这 个 值 会 
蒙特 卡 罗 积 


I 


小 于 2 或 大 了 
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习题 14.6.27 ”对 于 一 个 随机 变量 的 两 个 线性 无 关 的 副本 之 和 , 如 果 在 其 均值 和 方差 进行 适 
当 缩 放 后 , 仍 与 原来 的 变量 具有 相同 的 分 布 , 那么 说 最 初 的 分 布 是 稳定 的 . 本 章 已 经 证 明 
了 正 态 分 布 是 稳定 的 . 其 他 分 布 是 不 是 稳定 的 , 比如 均匀 分 布 、 指 数 分 布 和 二 项 分 布 ? 柯 
分布 是 否 稳定 , 其 概率 密度 函数 为 fx (x) = +i(1 十 x2)-1? 
习题 14.6.28 ” 设 久 服从 均值 为 是 方差 为 o 的 正 态 分 布 , 证 明 : X = aX 十 6 的 均值 为 
(ac 十 B), 方差 为 (ao). 
习题 14.6.29 ”在 “无 限 公司 ”中 , 房间 的 温度 服从 正 态 分 布 , 其 中 均值 为 55°F”, 标准 差 为 
2°F. 给 定 一 个 随机 房间 , 其 温度 介 于 55°F 与 65°F 之 间 的 概率 是 多 少 ? 
习题 14.6.30 ”你 正在 为 “无 限 公 司 ” 招 聘 员 工 . 作为 唯一 在 Bl 层 ( 即 -1 层 ) 工作 的 人 员 ， 
你 的 任务 是 对 潜在 雇员 进行 电话 面试 . 每 位 应 聘 者 都 被 告知 在 下 午 6 点 准时 打 电 话 . 
于 公司 喜欢 早起 的 鸟 儿 , 所 以 你 的 任务 是 只 让 那些 在 下 午 5 : 45 到 5 : 55 打 入 电话 的 应 
聘 者 通过 . 假设 面试 者 打 入 电话 的 时 间 服 从 一 个 连续 的 正 态 分 布 , 其 均值 为 下 午 6 点 , 标 
准 差 是 5 分 钟 . 如 果 你 必须 雇用 15 位 应 聘 者 , 那么 打 电 话 的 人 大 概 一 共有 多 少 个 ? 
习题 14.6.31 ”你 是 “无 限 公司 ”的 员工 , 在 位 于 Bl 层 的 地 下 室 工 作 . 该 建筑 的 楼 层 数 是 无 
穷 大 的 , 即 (一 00, ceo). 你 正在 等 电梯 回 家 , 但 在 这 一 天 , 电梯 会 在 电梯 井 里 随机 停留 . 不 
幸 的 是 , 你 所 在 的 楼 层 是 没有 紧急 楼 梯 和 出 口 的 唯一 两 层 楼 之 一 . 根据 安全 规定 , 电梯 门 
只 有 在 电梯 超过 或 低 于 地 面 1/5 的 地 方才 能 打开 . 例如 , 如 果 电 梯 停 在 [43.8, 44.2], 那么 
电梯 门 只 会 在 44 层 打开 . 如 果 电 梯 停 在 44.5, 那么 任何 楼 层 的 门 都 不 会 打开 . 假设 电梯 
的 停留 位 置 服从 均值 为 45 且 标 准 差 为 10 的 正 态 分 布 . 如 果 每 次 都 停留 1 分 钟 , 那么 在 
电梯 到 达 Bl 层 之 前 , 你 需要 等 待 多 长 时 间 ? 
习题 14.6.32 ”你 的 朋友 在 “无 限 公 司 ” 的 B24 层 工作 , 而 该 建筑 的 楼 层 数 是 无 穷 大 的 , 即 
(一 00, co). 不 幸 的 是 , 他 所 在 的 楼 层 是 没有 紧急 楼 梯 和 出 口 的 唯一 两 层 楼 之 一 . 1 小 时 后 ， 
他 在 291 层 有 个 重要 会 议 , 如 果 不 能 及 时 到 场 , 他 就 要 立即 终止 与 公司 的 雇用 关系 . 此 时 
的 电梯 状况 与 上 一 题 相同 . 你 的 朋友 向 人 力 资源 部 门 投诉 , 并 要 求 电梯 服务 . 经 过 与 公司 
经 理 的 协商 , 他 们 同意 帮助 你 的 朋友 , 但 有 条 件 . 他 们 会 直接 把 你 的 朋友 送 到 会 议 上 , 但 
前 提 是 要 满足 以 下 两 个 条 件 之 一 : 电梯 到 达 你 朋友 所 在 的 楼 层 , 或 者 电梯 在 同一 楼 层 连 
续 停靠 两 次 , 而 且 这 个 楼 层 要 低 于 30. 只 有 在 楼 层 的 电梯 门 打开 时 才 算 停靠 (参见 上 一 
题 ). 例如 , 当 电 梯 停 在 [24.8, 25.2] 时 , 我 们 只 能 认为 电梯 停靠 在 25 层 . 假设 电梯 的 停留 
位 置 服从 均值 为 45 且 标准 差 为 10 的 正 态 分 布 , 并 且 每 次 都 停留 一 分 钟 . 那么 , 在 迟到 
因此 被 解雇 之 前 , 你 的 朋友 已 经 到 达 会 议 室 的 概率 是 多 少 ? 
习题 14.6.33 ”继续 上 一 题 : 假设 “无 限 公司 ”的 经 理 很 大 度 , 并 对 电梯 进行 编程 . 当 随 机 数 
生成 器 返回 [30, 100] 的 任意 一 个 整数 时 , 电梯 就 会 重新 运行 . 这 幢 楼 的 上 下 方向 都 有 无 
限 多 层 . 
1) 你 朋友 的 胜算 会 提高 多 少 ? 为 什么 ? (提示 : 利用 有 预见 性 的 灵感 .) 
2) 公司 经 理 希 望 进一步 展现 他 的 大 度 . 当 随 机 数 生成 器 返回 [30, co] 的 任何 整数 时 , 电 
梯 都 会 重新 运行 . 此 时 , 你 的 朋友 能 顺利 解决 问题 的 概率 会 有 什么 变化 ? 


人 演 


人 演 


@ 华氏 度 , 55"Fs12.8"C. 一 一 编者 注 
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(3) 有 人 向 这 位 大 度 的 经 理 建 议 , 可 以 把 电梯 重新 运行 的 区 间 设 置 为 [45.9, 46], 但 经 理 
拒绝 这 样 做 , 理由 是 这 样 做 会 降低 成 功 的 可 能 性 . 假设 公司 经 理 精通 概率 , 那么 他 对 
成 功 的 定义 是 什么 ? 

习题 14.6.34 ”你 在 “无 限 公司 ”大 楼 的 Bl 层 工作 , 而 这 幢 楼 的 上 下 方向 都 有 无 限 多 层 . 你 
似乎 被 无 限期 地 困 在 了 Bl 层 . 为 了 逃生 , 你 在 壁橱 里 找到 一 个 传送 器 , 并 被 立即 传送 到 
B24 层 . 此 时 ， 人 力 资 源 部 门 得 到 警报 , 并 传送 了 两 位 代理 人 到 Bl 层 和 B29 层 . 另外 ， 
他 们 关闭 了 所 有 的 紧急 出 口 和 楼 梯 间 . 你 和 B29 层 的 代理 人 都 会 按照 均值 为 +2 层 、 标 
准 差 为 2 的 正 态 分 布 来 传送 . B1 层 的 代理 将 以 均值 为 -2 层 、 标 准 差 为 2 的 正 态 分布 
来 传送 . 注意 , 尽管 从 逻辑 上 看 , 当 你 被 传送 到 2.5 层 时 , 你 的 实际 位 置 是 2 层 , 但 传送 
器 会 认为 你 的 位 置 是 2.5 层 , 并 据 此 来 计算 下 一 次 传送 . 也 就 是 说 ， 层 的 概率 函数 对 
应 于 均值 为 (2.5 十 2 = 4.5) 且 标 准 差 为 2 层 的 分 布 . 从 这 一 刻 起 , 你 和 代理 人 每 30 秒 就 
要 被 同时 传送 一 次 . 如 果 你 在 任意 时 刻 与 其 中 一 位 代理 人 处 于 同一 楼 层 , 那么 你 的 传送 
器 将 被 禁用 , 而 你 会 被 带 到 人 力 资 源 办 公 室 处 理 文书 工作 . 如 果 能 在 此 之 前 到 达 1 层 , 你 
就 可 以 顺利 回 家 . 
(1) 你 回 家 的 可 能 性 有 多 大 ? 

(2) 你 被 抓 到 并 被 带 到 人 力 资源 办 公 室 处 理 文书 工作 的 可 能 性 有 多 大 ? 哪个 代理 人 抓 住 

你 的 可 能 性 更 大 ? 
(3) 在 被 抓 或 者 获得 自由 之 前 , 你 预计 会 持续 多 久 ? 
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本 章 将 探索 伽 马 函数 T(s) 的 一 些 奇怪 而 奇妙 的 性 质 . 


如 果 s > 0 (实际 上 , RR(s) > 0), 那么 伽 马 函数 工 (s) 就 是 


oo Oo d 
I(s) := 上 e xs 1dz = "| erzzs 一 ， 
0 0 化 


我 们 可 以 定义 无 数 个 积分 和 函数 . 看 看 这 个 函数 , 没有 任何 迹象 表明 它 是 数学 
领域 中 最 重要 的 函数 之 一 , 而 且 也 看 不 出 它 将 贯穿 于 整个 概率 论 和 统计 学 (以 及 其 


他 许多 领域 ), 但 事实 的 确 如 此 . 我 们 将 看 到 它 在 何 处 出 现 及 原因 , 并 对 它 的 很 多 重 


要 性 质 展开 讨论 . 如 果 你 等 不 及 了 , 那 就 在 继续 阅读 之 前 求 出 s=1、2、3 和 4 时 
的 积分 , 并 试 着 找 出 其 中 的 规律 吧 . 另外 , 试 着 找到 把 zs*-! 改写 成 zsdz/z 的 原因 . 


15.1 工 (s) 的 存在 性 


看 着 T(s) 的 定义 , 我 们 自然 会 问 : 为 什么 要 对 s 进行 限制 ? 每 当 看 到 一 个 被 
职 函 数 时 , 你 必须 要 确保 它 具 有 民 好 的 性 质 , 然后 才能 得 出 积分 存在 的 结论 . 本 节 


的 目的 是 强调 一 些 研究 积分 的 有 用 技巧 . 通常 , 我 们 需要 验证 二 个 很 容易 出 问题 的 


点 , 即 z=0 和 z= 士 co (好 吧 , 是 三 个 ). 


例如 , 考虑 定义 在 区 间 [0,co) 上 的 函数 f(z) = z-22. 该 函数 在 原点 处 的 值 趋 


近 于 无 穷 大 , 但 增加 速度 并 不 快 . 对 它 求 积 分 会 得 到 2z1/2, 而 
六 
lim zx-1/2dz 


它 在 原点 附近 是 可 


存在 且 有 限 . 遗憾 的 是 , 虽然 这 个 函数 趋 近 于 0, 但 当 x 较 大 时 , 它 趋 近 于 0 的 速度 


太 慢 , 从 而 导致 在 区 间 [0,co) 上 不 可 积 . 问题 在 于 , 像 


B 
lim ZL1/2dz 
B—o0 1 


这 样 的 积分 是 无 穷 大 的 . 反 向 问题 是 否 会 发 生 ? 也 就 是 说 , 对 于 较 大 的 x, 函数 衰减 
的 速度 足够 快 , 但 对 于 较 小 的 xz, 函数 增 到 无 穷 大 的 速度 会 相当 迅速 . 答案 是 肯定 
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的 一 一 考虑 g(z) = 1/z2. 注意 , 9 有 一 个 很 好 的 积 4 
C(zZz) = /aa 加 = -2 
当 x 的 值 较 大 时 , 积 4 a 即 


11B 、 1 
im 2)dz = im -了 | = lm |1 一 一 | < o%; 
1 B 


万 一 oo - 


但 是 , 当 zx Rn 积分 值 就 变 成 了 无 穷 大 : 


下 /om =- 到 - 寺 = 双 于 -二 = = 
因此 , 正 函 数 有 可 能 是 不 可 积 的 . 原因 在 于 , 当 xz 较 大 时 它 衰 减 得 太 慢 了 , 或 者 
当 2z 较 小 时 它 趋 近 于 无 穷 大 的 速度 太 快 . 一 般 情 况 下 , 当 z 一 co 时 , 对 于 任意 给 定 
的 e 如 果 一 个 函数 的 衰减 速度 大 于 1/zl+s, 那么 该 函数 在 无 穷 远 处 的 积分 值 是 有 
限 的 . 对 于 较 小 的 z, 当 z 一 0 时 , 如 果 一 个 函数 趋 近 于 无 穷 大 的 速度 小 于 zx-1+。， 
那么 该 函数 在 0 处 的 积 分 值 接近 于 0. 你 应 该 经 常 做 这 样 的 验证 , 并 对 事物 何 时 存 
在 以 及 是 否 有 明确 的 定义 有 一 定 的 了 解 . 

现在 回 到 伽 马 函 数 , 我 们 要 确保 对 于 任意 的 s > 0, 它 都 具有 良好 的 定义 . 被 积 
函数 是 e-*zs 1. 当 z 一 oo 时 , 因子 zs-! 呈现 多 项 式 增长 , 但 e-* 会 按照 指数 北 
减 , 因此 它们 的 乘积 会 迅速 衰减 . 如 果 想 更 仔细 、 更 严谨 , 可 以 这 样 论证 : 存在 某 个 
整数 M > s 十 1701 (这 里 给 出 一 个 很 大 的 数 是 为 了 提醒 你 , 实际 的 数 并 不 重要 ). 我 
们 显然 有 er > zY/M 这 正 是 er 的 泰勒 级 数 展开 式 中 的 一 项 (由 于 x > 0, 因此 
所 有 项 都 是 正 的 ). 于 是 , e-* < MIUzM. 对 于 较 大 的 x, 积分 有 限 且 具有 良好 的 性 


质 , 因为 它 有 上 界 
B B 
/ | MIzx- Mzrs-ldz 
1 


J/ - 
3 一 | 
MI! 1 ] 
5 一 M | 
记 住 , 我 们 的 目标 不 仅仅 是 理解 伽 马 函数 , 而 且 要 理解 一 般 函 数 . 因此 , 了 解 什么 样 
的 技巧 才 是 有 用 的 以 及 什么 时 候 使 用 这 种 技巧 非常 重要 . 上 述 方法 就 是 个 很 好 的 选 


择 . 由 于 ez 会 迅速 增加 , 所 以 e-” 会 快速 衰减 . 我 们 利用 e-* 的 衰减 来 处 理 zx-1. 
利用 衰减 来 约束 积分 是 种 很 棒 的 技巧 . 
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那么 在 z=0 附近 呢 ? 在 z=0 附近 , 函数 e-* 是 有 界 的 . 当 z=0 时 ,ez 取 
到 了 最 大 值 , 所 以 它 最 多 取 到 1. 于 是 


2 1 
ez22s 1dz < 1.2zs-ldz = 二 | = -. 
0 0 slo 5 


当 s > 0 时 , 我 们 证 明了 一 切 都 是 合理 的 , 那么 当 s < 0 时 呢 ? 这 些 值 仍然 有 
效 吗 ? 按照 之 前 的 论述 , 可 以 证 明 当 x 较 大 时 , 一 切 都 没 问 题 . 不 季 的 是 , 当 x 较 
小 时 , 情况 就 不 同 了 . 如 果 x < 1, 那么 显然 有 er? > 1/e. 在 寻找 可 以 证 明 积 分 存 
在 性 的 上 界 之 前 , 我 们 先 来 找 一 找 它 的 下 界 , 并 由 此 说 明 这 个 积分 会 趋 近 于 无 穷 大 . 
这 里 的 被 积 函数 至 少 与 x*-1Je 一 样 大 . 如 果 s < 0, 那么 这 个 函数 在 [0,1] 上 就 不 
可 积 了 . 为 了 更 加 具体 地 说 明 , 不 妨 设 s = -2. 于 是 有 


人 e Tr 3dz 之 人; Zr-3dz = -| 一 Coi 
现在 积分 值 趋 近 于 无 穷 大 . 
每 当 你 过 到 积分 时 , 上 面 的 论述 都 可 以 ( 且 应 该 ! ) 拿 来 使 用 . 虽然 上 述 分 析 并 
没有 解释 为 什么 每 个 人 都 要 关注 伽 马 函数 , 但 我 们 至 少 明 白 了 当 s > 0 时 , 伽 马 函 
数 是 有 定义 且 存 在 的 . 在 下 一 节 中 , 我 们 将 说 明 该 如 何 理解 伽 马 函 数 对 于 s 所 有 可 
能 的 取 值 均 有 意义 . 这 让 人 有 些 担 忧 : 我 们 刚刚 用 了 一 节 的 内 容 来 讨论 要 小 心地 确 
保 只 使 用 定义 明确 的 积分 , 而 现在 就 要 讨论 输入 s = 1/2 这 样 的 值 ? 显然 , 无 论 我 
们 做 什么 , 都 不 会 像 直 接 把 s = 1/2 代入 公式 那么 简单 . 
有 兴趣 的 话 , 可 以 看 一 下 T(1/2) = Va 我 们 很 快 会 给 出 该 式 的 证 明 ! 
如 果 你 正在 寻找 有 趣 的 积分 , 那 就 探究 一 下 ”f(z)dz 是 否 存在 , 其 中 


二 
f(x) = (z+1)log?(z+1) 石 X>0 
， 其 他 


无 穷 远 处 的 积分 值 是 多 少 ? 0 处 的 呢 ? 


15.2 工 (s) 的 函数 方程 


现在 来 看 一 下 T(s) 最 重要 的 性 质 . 这 条 性 质 可 以 让 我 们 理解 任意 一 个 s 值 作 
为 输入 的 意义 , 比如 上 一 节 中 的 s = 1/2. 显然 , 这 并 不 意味 着 只 是 单纯 地 把 任意 s 
代入 定义 中 , 但 很 多 优秀 的 数学 家 会 不 小 心 这 样 做 . 我 们 将 要 看 到 的 是 解析 (或 亚 
纯 ) 延 拓 . 这 种 做 法 的 要 点 是 , 给 出 一 个 定义 在 某 区 域 上 的 函数 f, 并 把 f 的 定义 
推广 到 更 大 的 区 域 上 , 从 而 得 到 该 区 域 上 的 一 个 新 函数 g. 新 函数 9 与 了 在 共同 区 
域 上 的 定义 是 一 样 的 , 但 9 还 在 更 多 点 处 有 定义 . 


= 
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下 面 的 廖 论 就 是 个 很 好 的 例子 . 
1+2+4+8 二 16 十 32 十 64 十 … 


等 于 多 少 ? 我 们 把 2 的 方 归 全 都 加 在 了 一 起 , 所 以 它 显 然 是 无 穷 大 , 对 吧 ? 错 , 这 个 
和 的 “自然 ”含义 是 -1! 无 穷 多 个 正 数 项 之 和 是 负 的 ? 这 里 发 生 了 什么 ? 
这 个 例子 来 源 于 你 可 能 已 经 见 过 很 多 次 的 几何 级 数 . 如 果 令 


那么 只 要 |r| < 1, 上 述 和 就 是 这. 这 一 点 可 以 从 多 个 角度 来 考察 . 最 常见 也 最 无 
聊 的 一 种 思路 就 是 令 


Sn 一 工 十 了 十 十 7 
如 果 考 察 5, - rw 那么 所 有 项 几乎 都 被 消 掉 了 , 只 剩 下 


Si —75%, = 工 一 rn+1l， 
等 号 左 端 整理 成 (1 - ”)S。 然后 两 端 同时 除 以 1 - ” 就 得 到 了 
1 一 rm 十 1 
= Tr 


如 果 |r| < 1 那么 lm or=0. 对 上 式 取 极 限 可 得 


> 1 一 rn+1i 1 
4 lm 5, = lim 一 天 


九 一 co 一 亿 1 一 7 


WU 
这 就 是 所 谓 的 几何 级 数 公式 , 可 以 用 来 解决 各 种 问题 . 更 有 趣 的 推导 过 程 , 请 参阅 
1.2 节 . 
现在 改写 上 面 的 过 程 . 求 和 符号 很 好 也 很 简洁 , 但 这 不 是 我 们 现在 想 要 的 一 一 
我 们 想 看 看 这 里 到 底 发 生 了 什么 . 现在 有 


1 
1 十 7 十 r2 十 7r3 十 r4 十 r5 十 r6 十 .一 < 
六 


由 过: 
注意 , 等 号 左 端 仅 当 |r| < 1 时 有 意义 , 但 右 端的 式 子 对 1 以 外 的 所 有 r 均 有 意义 ! 
我 们 说 , 右 端 是 左 端的 解析 延 拓 , 且 在 s = 1 处 有 一 个 极点 (极点 是 函数 趋 近 于 无 穷 
大 的 地 方 ). 

我 们 定义 函数 
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现在 我 们 已 经 准备 好 面 对 这 个 大 问题 了 : f(2) 是 多 少 ? 如 果 使 用 第 二 个 定义 , 它 就 
是 这 = 一 1, 但 如 果 使 用 第 一 个 定义 , 它 就 是 把 2 的 方 景 全 都 加 在 一 起 而 得 到 的 
奇怪 的 和 . 这 就 是 我 们 所 说 的 “2 的 全 体 方 宗 和 等 于 -1” 的 意义 . 我 们 并 不 是 把 2 
代入 级 数 展开 式 中 , 而 是 计算 推广 函数 在 2 处 的 函数 值 . 

是 时 候 把 这 些 技巧 应 用 到 伽 马 函 数 中 了 .我们 将 证 明 , 利用 分 部 积分 法 , T(s) 
可 以 推广 到 所 有 s 上 (至 少 可 以 推广 到 除 负 整 数 和 0 之 外 的 所 有 数 上 ). 在 研究 一 
般 情 况 之 前 , 我 们 先 考察 一 些 具 有 代表 性 的 例子 , 看 看 为 什么 分 部 积分 是 个 好 方法 ， 
并 对 伽 马 函 数 的 性 质 有 一 定 了 解 . 回顾 一 下 ， 


So 


TI(s) = | e xs dx, s>0. 
0 


最 简单 的 s 值 是 s = 1, 因为 这 会 让 zs 变 成 x? = 1. 在 这 种 情况 下 , 我 们 有 


互 


IT(1) = 让 e dz = -ee “| = -0+1=1. 
0 0 


下 一 个 最 简单 的 s 值 是 多 少 ? 通过 简单 的 试验 , 我 们 令 s = 2. 这 会 让 z*- 等 于 zw， 
它 是 个 不 错 的 整数 究 . 于 是 


现在 我 们 开始 理解 为 什么 分 部 积分 法 会 发 挥 如 此 重要 的 作用 了 . 如 果 令 =z 了 且 
dv =erzdz, 那么 du = dx 且 wv =e-*. 接 下 来 , 我 们 会 看 到 重要 的 一 步 刚 开 始 
要 算 ze-* 的 积分 , 在 利用 分 部 积分 法 之 后 , 只 需要 处 理 erz 的 积分 , 这 是 种 很 棒 的 
简化 方法 . 若 给 出 具体 细节 , 则 有 
十 上 e “dz. 
0 


边界 项 消失 了 (-ze-* 在 0 处 的 值 显然 为 0. 利用 洛 必 达 法 则 来 计算 它 在 oo 处 的 
值 , 可 得 lims_w 总 = lims_w 十 =0), 而 另 一 个 积分 就 是 T(1). 因此 , 我 们 证 明了 


TOO) = wl -|/ vdu = 一 Ze ” 
0 


rT(2) = T(1). 


然而 , 如 果 用 一 种 略微 不 同 的 方式 来 写 这 个 过 程 , 那 就 更 有 启发 性 了 . 令 久 = x, 从 
而 有 dw = dz. 我 们 把 这 两 个 式 子 改写 成 & = ZL 和 du = ldz. 这 样 就 得 到 了 


rT(2) = 1:.T(1). 


现在 , 你 应 该 有 些 怀疑 : 这 真 的 重要 吗 ? 任何 东西 乘 以 1 都 仍 是 它 自 身 ! 这 确实 
重要 , 需要 提醒 你 的 是 , 我 们 的 工作 与 二 项 式 系 数 以 及 组 合 学 有 关 . 当 计 算 T(3) 


~ 
7 
[dll 


410 第 15 章 伽 马 函 数 与 相关 分 布 


时 , 我 们 发 现 它 就 等 于 2 .T(2); 如 果 继 续 求 工 (4) ns 会 看 到 它 是 3 .T(3). 这 种 
规律 表明 了 工 (s 十 1) = sT(s), 现在 就 来 证 明 这 一 点 . 
证 明 :” 当 RR(s) > 0 时 , T(s 十 1) = 0 我 们 有 


IT(s+1) = e zstl- ldz | e “zx’dz. 
0 0 


现在 进行 分 部 积分 . 令 w= zs 且 dv = e-*dx. 基本 上 只 能 这 样 做 , 因为 e-* 有 一 
个 很 好 的 积分 , 而 且 在 求 u = zs 的 微分 时 , 多 项 式 的 次 数 会 下 降 , 这 样 就 能 得 到 更 
简单 的 积分 . 于 是 有 


w= 7x, du = szs ldz, dv = e ?drx, wv = ~e?”, 
进而 有 
Co CO 
T(s 十 1) 三 一 Zee ?” + 1/ e Tsrs ldz 
0 0 
OO 
=0+s/ e “zs dz = sT(s), 
0 
结论 得 证 . 


这 个 结论 非常 重要 , 有 必要 单独 列 出 来 , 并 对 其 命名 . 
T(s) 的 函数 方程 : 伽 马 函数 满足 


IT(s+1) = sT(s). 


根据 上 式 , 可 以 把 伽 马 函 数 推广 到 所 有 s 上 . 这 种 推广 也 被 称 为 伽 马 函数 . 除了 
负 整 数 与 0 以 外 , 对 于 所 有 的 s, 伽 马 函 数 都 是 定义 明确 且 有 限 的 . 

我 们 回 到 上 一 节 的 例子 . 稍 后 将 证 明 T(172) = Va. 现在 , 假设 我 们 已 知 该 式 成 
立 , 并 演示 如 何 计算 下 (-3/2). 由 函数 方程 可 知 , F(s+ 1J) = sT(s). 这 个 式 子 可 以 改 
写成 T(s) = s-1T(s 十 1). 利用 这 一 点 , 我 们 可 以 从 未 知 的 s = -3/2 一 步 步 “ 走 出 
来 ”, 直到 已 知 的 s = 1/2. 于 是 


r( -= sr (3) = .Car 人 3) = 络 
2 3 2 3 2 
这 就 是 函数 方程 的 力量 一 一 只 要 知道 s > 0 (或 者 更 一 般 地 , RR(s) > 0) 时 伽 马 


函数 的 取 值 , 就 可 以 在 任何 地 方 定义 伽 马 函数 . 为 什么 0 和 负 整 数 这 么 特殊 呢 ? 好 
吧 , 来 看 一 看 (0): 


工 (0) =/ eT?zxo1dz = e-®zx-1dz. 
0 0 
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问题 在 于 , 上 式 是 不 可 积 的 . 虽然 被 积 函 数 在 x 较 大 时 会 衰减 地 非常 快 , 但 当 x 较 
小 时 , 被 积 函 数 看 起 来 像 1/z. 具体 地 说 : 


a de fd 人 
lim e “xz dzz -lim — = -limlogx| = lim—loge = 0o%. 
< 一 0 .| ee0f. -Tw e e—0 € < 一 0 


因此 , FT(0) 是 无 定义 的 , 那么 由 函数 方程 可 知 , 伽 马 函数 对 所 有 的 负 整数 也 是 无 定 
义 的 . 
15.3 ”阶乘 函数 与 工 (s) 


上 节 证 明了 T(s) 满足 函数 方程 T(s + 1) = sr(s). 这 让 人 想起 了 一 个 更 好 的 关 
系 式 , 即 阶乘 函数 . 回顾 一 下 


nl = n(n m1):(n— 2):..….3.2.1. 


用 更 具 启 发 性 的 方式 来 写 , 即 


n=n: (no 1)!. 


注意 , 这 与 T(s) 满足 的 关系 式 非 常 相似 . 这 并 不 是 巧合 , 伽 马 函数 是 由 阶乘 函数 推 
广 而 来 的 ! 


FT(s) 与 阶乘 函数 : 如 果 n 是 一 个 非 负 整数 , 那么 Tn 十 1) = nl. 因此 , 伽 马 函 数 
是 阶乘 函数 的 推广 . 

我 们 将 证 明 工 (1) = 1, T(2) = 1, FT(3) = 2, 等 等 . 这 可 以 解释 为 , 当 n € {1,2,3} 
时 , FT(n) = (n= 1)1. 然而 , 利用 函数 方程 , 我 们 可 以 把 这 个 等 式 推广 到 所 有 的 n. 归 
纳 法 可 以 做 到 这 一 点 . 利用 归纳 法 证 明 有 两 个 步骤 : 基本 情形 (证 明 在 某 种 特殊 情 
况 下 绪论 成 立 ) 和 归纳 步 又 (假设 结论 适用 于 n, 然后 证 明 它 也 适用 于 n 十 1). 要 回 
顾 并 了 解 该 技巧 的 其 他 示例 , 请 参阅 A.2 节 . 

我 们 已 经 考察 了 基本 情形 , 验证 了 工 (1) = 0!. (这 可 能 是 你 人 生 中 为 数 不 多 地 
在 语法 上 正确 使 用 感叹 号 和 句号 来 作为 句子 的 结尾 . 不 使 用 另 一 个 感叹 号 来 表示 兴 
奋 是 对 的 , 因为 ! 被 称 为 双 阶 乘 , 它 在 概率 中 也 是 有 意义 的 ! ) 我 们 还 验证 了 更 多 
的 例子 . 在 进行 归纳 证 明 时 , 这 是 种 很 好 的 策略 . 通过 亲自 考察 一 些 具体 情况 , 你 能 
更 好 地 了 解 正在 发 生 的 事情 , 并 看 出 其 中 的 规律 . 还 记得 最 初 写 的 是 T(2) = TT(1)， 
但 经 过 一 些 思考 (并 根据 多 年 的 经 验 ), 我 们 把 它 改写 成 T(2) = 1:T(1). 

现在 来 看 归纳 步骤 . 假设 (mn) = (mn 一 1)!, 我 们 必须 要 证 明 FT 二 DT = mL 从 
函数 方程 T(n 十 1) = nT(n) 开始 , 而 由 归纳 假设 可 知 T(n) = (2 一 1)1. 把 这 两 个 式 


上 
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子 结合 起 来 就 得 到 了 FT 十 1) = n(n 一 1)!, 这 就 是 nl, 或 者 说 , 这 正 是 我 们 要 证 明 
的 结论 . 结论 得 证 . 

现在 我 们 有 两 种 不 同 的 方法 来 计算 1020!. 第 一 种 是 做 乘法 运算 : 1020 . 1019 . 
1018…. 第 二 种 方法 是 考察 相应 积分 : 


1020! = T(1021) ey ezz1020d7 
0 


这 两 种 方法 各 有 优点 , 但 我 想 对 积分 法 的 一 些 优点 展开 讨论 , 因为 是 大 多 数 人 未 曾 
了 解 的 . 积分 很 难 , 大 多 数学 生 直到 高 中 或 大 学 时 才 认 识 它 . 我 们 都 知道 如 何 进 行 
乘法 运算 一 一 从 小 学 开始 , 我 们 就 一 直 这 样 做 . 那 为 什么 要 自 找 麻 烦 , 把 简单 的 乘 
法 问题 转化 为 积分 呢 ? 

这 样 做 是 基于 数学 的 一 般 原 则 一 一 通常 , 当 你 站 在 更 高 的 层次 上 、 以 不 同 的 方 
式 来 看 待 事物 时 ， 就 会 看 到 一 些 可 以 利用 的 新 特性 ， 另 外 , 一旦 把 它 写 成 积分 , 我 
们 就 有 了 更 多 的 工具 , 可 以 利用 积分 理论 和 分 析 学 的 相关 结果 来 研究 问题 . 在 第 18 
章 中 , 我 们 就 是 这 样 做 的 . 把 阶乘 函数 看 作 积分 来 重新 研究 , 看 看 我 们 能 学 到 多 少 
有 关 阶 乘 函数 的 知识 . 

注 ”本 节 涉 及 的 关系 非常 重要 , 在 继续 阅读 之 前 , 有 必要 回顾 一 下 . 在 本 书 的 
前 几 章 中 , 我 们 利用 组 合 与 概率 做 了 很 多 事情 . 阶 来 函数 几乎 总 是 潜伏 在 背景 中 , 要 
么 直接 出 现在 概率 乘法 树 中 , 要 么 间接 出 现在 二 项 式 系数 中 (回顾 一 下 (”). 在 不 
考虑 次 序 的 前 提 下 , 从 n 个 对 象 中 选 出 天 个 共有 nl/(kl(n 一 有)!) 种 方法 )， 本 节 将 
阶乘 函数 与 伽 马 函 数 联系 起 来 , 并 提出 利用 微 积 分 与 实 分 析 的 知识 可 以 加 深 我 们 的 
理解 . 


15.4 工 (s) 的 特殊 值 


我 们 知道 了 (s 十 1) = sl, 其 中 s 是 一 个 非 负 整数 . s 还 有 其 他 的 重要 值 吗 ? 如 
果 有 , 这 些 值 是 多 少 ? 换 名 话说, 我 们 刚刚 推广 了 阶乘 函数 . 重点 是 什么 ? s 取 非 整 
数值 或 许 只 能 满足 我 们 的 好 奇 心 、 并 不 重要 , 重点 可 能 在 于 利用 微 积 分 和 分 析 学 工 
具 来 研究 nl. 然而 , 事实 并 非 如 此 . 其 他 一 些 值 在 概率 上 也 非常 重要 . 提前 透露 一 
下 , 我 们 会 说 这 些 值 起 着 核心 作用 . 

那么 , s 的 重要 值 是 多 少 ? 利用 冰 数 方程 , 一 旦 知道 了 工 (1) 的 值 , 我 们 就 得 到 
了 s 取 所 有 非 负 整 数 时 的 伽 马 函数 值 , 这 就 给 出 了 所 有 的 阶乘 . 因此 , 1 是 s 的 一 
个 重要 值 . 接 下 来 该 考察 哪个 ? 在 整数 之 后 , 最 简单 的 数 是 形 如 ny2 的 半 整 数 , 其 
中 ”是 整数 . 最 简单 的 非 整 数 是 1/2. 现在 , 我 们 将 会 看 到 s = 1/2 也 十 分 重要 . 

正 态 分 布 即使 不 是 最 重要 的 分 布 , 也 是 最 重要 的 分 布 之 一 ( 详 见 第 14 章 ). 如 
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果 随 机 变量 X 的 概率 密度 函数 是 
1 
V3mo5 
那么 说 X 服从 均值 为 4 且 方 差 为 o? 的 正 态 分 布 , 并 记 作 X ~ N(1,o). 看 一 下 
这 个 概率 密度 函数 , 它 分 为 两 部 分 , 即 指数 部 分 与 常数 因子 1/V2rc2. 因为 指数 函 
数 衰减 得 非常 快 , 所 以 积分 是 有 限 的 . 因此 , 如 果 进 行 适 当 的 标准 化 , 我 们 就 会 得 至 
一 个 概率 密度 函数 . 难点 在 于 确定 这 个 积分 是 什么 . 设 g(z) = ee- /2 .因为 
9 的 衰减 速度 非常 快 , 并 且 是 非 负 的 , 所 以 可 以 将 其 重新 调整 为 积分 值 为 1， 这 样 就 
得 到 了 一 个 概率 密度 函数 . 这 里 的 调整 因子 是 1/c 其 中 


他 一 入 @—(2—/)° /20° 


在 第 14 章 中 , 我 们 看 到 了 正 态 分 布 的 大 量 应 用 与 用 法 . 证 明 这 个 分 布 的 重 
性 并 不 难 , 所 以 我 们 想 知道 这 个 积分 值 是 多 少 . 也 就 是 说 , 这 个 积分 为 什么 会 出 现 
在 关于 伽 马 函数 的 这 一 章 里 ? 

原因 是 只 要 做 一 些 代数 运算 和 变量 蔡 换 , 我 们 就 能 看 到 这 个 积分 就 是 V3T(1/2) 
2. 不 妨 设 j=0 目 o = 1 (如 果 不 这 样 做 , 那么 第 一 步 就 是 变量 替换 , 令 t= 号) 


所 以 , 我 们 来 考察 
一 BS -7 /2dz = 2 和 -2 /2qz. 
Ee [ oe/2dy 


利用 对 称 性 , 积分 区 间 可 以 被 简化 成 从 0 到 co (参见 A.4 节 ). 这 个 式 子 与 伽 马 函数 
的 关联 看 起 来 还 很 模糊 . 伽 马 函数 是 e-* 乘 以 z 的 多 项 式 的 积分 , 但 这 里 是 -x?/2 
的 指数 函数 . 看 到 这 里 , 我 们 想到 一 个 自然 的 变量 替换 , 它 可 以 让 我 们 的 积分 看 起 
来 像 伽 马 函 数 在 某 个 特定 点 的 值 . 试 着 令 wu = 22/2, 这 是 可 以 得 到 负 变 量 指数 的 唯 
一 方法 . 我 们 想 通 过 变量 蔡 换 把 dz 写成 关于 u 和 du 的 表达 式 , 于 是 现在 把 w= 2 
改写 成 z = (2w)!2, 进而 有 dz = (2w)-12du. 把 这 些 代 入 上 述 积分 , 则 有 


丰 二 #| e+(2u) -1/2du = vi/ ev 1/2du. 
0 0 


-2 /125 ， 


Je(z) 二 


= 


re 
2 


差不多 完成 了 , 这 看 起 来 确实 非常 接近 伽 马 函 数 . 现在 只 有 两 个 问题 : 一 个 微 不 足 
道 , 另 一 个 很 容易 解决 . 第 一 个 问题 是 , 我 们 使 用 了 字母 v 而 不 是 x, 但 这 很 好 , 因 
为 可 以 用 任意 字母 来 表示 变量 . 第 二 个 问题 是 , F(s) 中 的 因子 是 ws-1, 但 上 述 积 4 
中 是 22. 这 很 容易 解决 , 只 需要 改写 成 
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我 们 刚刚 添加 了 0, 这 是 数学 中 最 有 用 的 技巧 之 一 . (学 会 “不 做 任何 事 ” 是 需要 一 
段 时 间 的 , 也 是 为 什么 我 们 经 常 指出 这 一 点 的 原因 .) 因此 


I = Vf du = V2T(1/2). 
0 


我 们 做 到 了 , 找到 了 s 的 另 一 个 很 重要 的 值 . 现在 只 需要 求 出 T(1/2) 等 于 多 
少 ! 我 们 当然 可 以 回 到 标准 正 态 分 布 的 概率 密度 函数 并 使 用 极 坐 标 技巧 (参见 14.1 
节 ), 然而 还 可 以 使 用 余 割 等 式 来 直接 求 出 这 个 值 . 


余 割 等 式 : 如 果 s 不 是 整数 , 那么 


LT(s)T(1—s) = ncsc(xs) = w 


sin(TSs) 


15.8 节 会 给 出 一 些 不 同 的 证 明 . 注意 , 上 式 意 味 着 T(1/2) = VE 

注 有 必要 再 次 说 明 为 什么 选择 研究 s = 1/2. 我 们 已 经 掌握 了 s 取 正 整数 
时 的 伽 马 函数 , 但 仍 需要 再 清楚 接 下 来 要 研究 什么 .在 跑 之 前 先 学 会 走 ， 在 讨论 
5 二 V2 或 s=Xz 之 前 , 最 好 先 试 一 试 最 简单 的 数 . 那么 . 除了 正 整 数 之 外 的 最 简单 
的 数 是 什么 ? 应 该 是 最 接近 于 正 整 数 的 数 . 这 种 思路 引导 我 们 想到 了 半 整 数 , 希望 
你 能 看 出 这 个 很 自然 的 过 程 . 


15.5 ”贝塔 函数 与 伽 马 函 数 
贝塔 函数 的 定义 为 


1 
Bla,b) = tel1(1— tt) 1dt, ab > 0. 
0 


注意 贝塔 函数 与 伽 马 函 数 的 相似 之 处 , 两 者 都 涉及 将 积分 变量 自 乘 到 参数 减 1 次 
窜 . 事实 证 明 , 这 并 不 是 巧合 或 想象 , 而 是 这 两 个 函数 之 间 的 确 有 密切 的 关联 . 


贝塔 函数 的 基本 关系 式 : 当 a,5 > 0 时 , 我 们 有 


于 
Bl(a,db) := 人 t°-1(1—t) ldt = i 
0 


做 一 点 代数 运算 , 可 以 重新 排列 上 面 的 式 子 , 从 而 得 到 


T(at+b) f° ai 3 
ete) (1—t) -1dqt = 1. 


15.5 贝塔 函数 与 伽 马 函 数 415 


这 意味 着 我 们 发 现 了 一 个 新 的 概念 . 


贝塔 分 布 : 设 a,b > 0. 如 果 随 机 变量 X 服从 参数 为 a 和 的 贝塔 分 布 , 那么 它 


Tl(a 本 0) Pe p_1 于 
三 | KOI (1—t) ”二 
0 


其 他 . 
我 们 记 作 X ~ B(a,b). 

我 们 会 在 15.7 节 中 更 详细 地 讨论 这 个 分 布 , 现在 只 简单 地 说 它 是 一 族 重要 的 

概率 密度 函数 . 我 们 的 输入 通常 会 介 于 0 和 1 之 间 , 而 a 和 ?这 两 个 参数 在 创建 


“ 单 峰 ”分 布 ( 即 概率 密度 先 上 升 然后 下 降 ) 时 给 了 我 们 很 大 的 
了 其 中 儿 个 概率 密度 函数 . 


自 1 


. 图 15-1 展示 


图 15-1 当 (a,5) 等 j 


F (2,2)、(2,4)、(42) 和 (3,10) 时 , 贝塔 分 布 的 概率 密度 函数 
15.5.1 ”基本 关系 式 的 证 明 


我 们 来 证 明 贝 塔 函数 的 基本 关系 式 . 虽然 这 个 结果 很 重要 , 但 要 记 住 我 们 这 样 
做 的 目的 是 帮助 你 了 解 如 何 解 决 这 类 问题 . 两 端 同时 乘 以 F(a 十 5), 看 到 要 证 明 的 
是 
1 
T(a)T(b) =T(a+D) [ to 1(1 —t) dt. 
0 
有 两 种 方法 可 以 做 到 : 既 可 以 考察 伽 马 函数 的 乘积 , 也 可 以 展开 TIT(a+b) 项 并 将 其 
与 男 一 个 积分 相 结 合 . 
我 们 试 着 处 理 伽 马 函 数 的 乘积 . 注意 , 因为 假设 了 wb > 0, 所 以 可 以 自由 地 使 
用 积分 表达 式 . 我 们 将 沿 着 余 割 等 式 的 第 一 种 说 


E 明 思路 (参见 15.8.1 节 ) 来 论证 ， 


416 第 15 章 伽 马 函 数 与 相关 分 布 


于 是 有 
T(a)L(b) = [ee Ee a e yy ldy 


-人 fe —(z+Y) 7 (2 ye ldzdy. 
ed 


记 住 , 不 能 改变 积分 次 序 . 因为 这 两 个 变量 是 彼此 独立 的 , 所 以 交换 次 jn 
任何 东西 . 现在 叭 的 选择 是 变量 蔡 换 . 我 们 把 y 固定 , 并 对 z 求 积 分 . 令 z = yu 
那么 dz = ydu. 这 至 少 把 变量 融合 在 了 一 起 , 对 很 多 问题 来 说 其 实 是 个 不 错 的 选 
择 。 我们 有 


rorO= | ey yl a 


co co 
三 人 上 yet+p lu le tw)ydqudy 
y=0 Ju=0 
co co 
二 /| ye to lye le (tyqydu. 
u=0 =0 


进行 了 变量 替换 并 交换 了 积分 次 序 . 现在 把 u 固定 , 并 对 y 求 积分 . 对 于 固定 
的 wu, 考虑 变量 替换 t = (1 + wjy， 这 是 个 不 错 且 比 较 合理 的 选择 . 我 们 想 要 得 到 
T(a ++), 因此 希望 出 现 一 个 变量 的 负 指 数 . 现在 有 e-0+%Y, 但 它 并 不 是 我 们 想 要 
的 形式 . 但 是 , 如 果 令 t= (1 十 wy, 上 式 就 变 成 了 e-!'. 同样 , 进行 这 个 变量 蔡 换 的 
原因 是 , 我 们 想 要 得 到 类 似 于 T(a 十 5b) 的 东西 . 注意 , 对 答案 有 一 定 的 了 解 是 多 么 
有 用 ! 
不 管 怎样 , 如 果 t= (1 十 w)y, 那么 dy = dt/G + 而 积分 就 变 成 了 


a++b—1 1 
Ur le 一 一 一 二 dtdu 
和 工 十 
LF Ce Vs eta] on 
1++u 
ooe 一 1 了 
=r(ard | ™ du 
w=0 \1 二 4 I 


这 里 使 用 了 伽 马 函 数 的 定义 , 把 t 积分 蔡 换 成 了 T(a 十 中 . 我 们 取得 了 很 大 的 进展 ， 
见 在 已 经 有 了 因子 T(a 填 台 ). 

另外 , 还 应 该 说 明 一 下 上 面 的 代数 运算 是 如 何 展开 的 . 把 所 有 方 容 为 a 一 1 的 
项 结合 在 一 起 , 这 样 就 只 剩 下 了 方 寡 为 +1 的 项 . 这 也 是 种 很 好 的 迹象 . 我 们 试图 
证 明 , 这 个 结果 就 等 于 (a 十 5) 乘 以 一 个 包含 z*-! 和 (1 一 x)*7! 的 积分 . 虽然 这 
并 不 是 精确 的 结果 , 但 已 经 非常 接近 了 . (你 可 能 会 担心 目前 得 到 的 是 5b 十 1 而 不 是 
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b 一 1, 不 过 再 进行 一 次 变量 蔡 换 之 后 , 这 个 问题 就 会 得 到 解决 .) 看 看 现在 有 什么 ， 
再 将 其 与 我 们 想 要 的 结果 进行 比较 , 下 一 个 变量 替换 是 什么 ? 不 妨 设 7 = 这 那 
么 1 一 7 二 二 且 dr= Ty (利用 商 的 求 导 法 则 ), 或 者 du = (1 十 w)?d7 = Sy. 
因为 :0 一 00, 所 以 7:0 一 1， 


这 正 是 我 们 想 要 证 明 的 结果 ! 为 什么 令 7 = 汉 .? 记 住 , 我 们 想得到 贝塔 积分 , 它 
的 被 积 函数 是 (7 小 于 1) 的 方 寒 与 1 _ 7 的 方 寒 的 乘积 , 因为 v 的 取 值 范围 是 从 
0 到 oo, 所 以 和 ,的 取 值 范围 是 从 0 到 1. 这 表明 r = ;会 是 一 个 有 用 的 变量 
替换 . 

注 ” 像 往常 一 样 , 经 过 漫长 的 证 明之 后 , 应 该 停 下 来 想 一 想 我 们 都 做 了 什么 ， 
以 及 为 什么 要 这 样 做 . 我 们 进行 了 几 次 变量 替换 并 交换 了 一 次 积分 次 序 . 因为 已 经 
讨论 过 这 些 变量 替换 为 什么 是 合理 的 , 所 以 不 再 重复 . 然而 , 我 们 将 重申 了 解答 案 
是 多 么 有 用 . 如 果 能 在 一 定 程度 上 靖 出 答案 , 就 能 准确 地 洞察 到 该 做 什么 .在 这 个 
问题 中 ,知道 目标 是 找到 因子 Fa 十 只 可 以 帮助 我 们 选择 合适 的 变量 替换 来 修正 
间 数 . 在 了 解 到 想 要 的 因子 是 某 个 变量 的 w 一 1 次 方 后 , 我 们 就 会 想到 做 变量 替换 


7 一 


15.5.2 ”基本 关系 式 和 TT(1/2) 
下 面 给 出 (1/2) 的 另 一 种 推导 , 这 次 使 用 贝塔 函数 的 性 质 . 令 a = 5= 1/2, 3 


工 (3) 1 (3) = (3 十 3 ) i -2 dt 
=T(1) | 020 12at 


与 之 前 一 样 , 问题 变 成 了 : 该 怎么 做 变量 替换 ? 回顾 一 下 对 伽 马 函数 和 余 割 等 式 的 
讨论 , 我 们 会 认为 T(1/2)2 应 该 是 x/ sin(r/2). 这 告诉 我 们 , 三 角 函 数 可 能 会 发 挥 重 
要 作用 , 所 以 要 做 一 些 有 助 于 使 用 三 角 函 数 或 三 角 蔡 换 的 事情 . 为 此 , 一 种 可 能 的 
做 法 是 令 t= ww. 这 会 让 因子 (1 -为 -22 等 于 (1 一 局 )-1/2, 非常 适合 做 三 角 蔡 换 . 

现在 看 一 下 细节 . 令 t= 忆 或 w=t12, 那么 du = dt/2t12 或 {1/2dt = 2du. 
之 所 以 这 样 做 , 是 因为 我 们 已 经 得 到 了 t1/2dt! 积分 上 下 限 仍然 是 0 和 1, 现在 有 


1\? , 
(3) | (1 — wu?) -1/22du. 
0 


Il! 


是 
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接 下 来 做 三 角 替 换 . 令 


(我 们 选择 w = sinb0 而 不 是 w = cos9 的 原 
到 x/2, 而 不 是 从 x/2 到 0. 不 过 这 两 种 替换 方式 都 是 正确 


4 一 sin0, du =cos0d0, 于 是 v :0 一 1 就 变 成 了 0:0 一 /2. 
因 是 , 这 种 方法 会 让 积分 区 间 变 成 从 0 
的 .) 此 时 有 


1 2 /2 
) = a/ (1 — sin? 0)-1/2 cos 0d0 
0 


a 


2 
2 cosbdb 
2 上 (cos2 0)1/2 
/2 元 
-=2/ d0 = 2.3 一 
这 就 给 出 了 考察 T(1/2) = Vr 的 另 一 种 方法 . 
15.6 ” 正 态 分 布 与 伽 马 函 数 
如 果 不 提 及 与 正 态 分 布 的 其 他 关联 , 对 伽 马 函数 的 阐述 就 是 不 完整 的 . 与 标准 
正 态 分 布 相关 的 三 最 重要 的 积分 是 
考生 ez /2dz 
0 一 Z 后 er-z /2dz 
a 元 
ss 0)2 . 1 一 Z2/2 
一 [ 0) a e d 
第 四 有 用 的 积分 是 2m 阶 矩 , 即 
Via = er 2 遍 e-® /2dz = (2m 一 1)!!, 
ee Tn 


这 很 容易 理解 ， 
度 非常 
作 来 证 明 , 对 高 斯 分 
如 果 我 们 非常 


其 中 , 双 阶 乘 的 意思 是 取 遍 相差 一 的 项 直至 取 到 2 
6!! = 6 .4.2). 我 们 


快 , 所 以 积分 会 收敛 于 0. 其 他 


或 1 为 上 (所 以 51=5.3.1, 而 
因为 它们 都 等 于 0. 

区 域 上 的 积分 . 因为 被 积 函 数 衰 减速 
积分 则 比较 厅 烦 , 因为 我 们 不 得 不 做 很 多 工 
度 函 数 的 积分 值 为 1 且 方 差 也 为 1. 


不 考察 奇 数 阶 逢 ， 
我 们 求 的 是 奇 函数 在 对 称 


) 布 而 言 , 其 概率 密 


了 解 伽 马 函 数 , 就 可 以 马上 得 到 任意 偶数 阶 矩 . 现在 要 做 的 就 是 


进 


行 简单 的 变量 替换 . 于 


和 1 
H2m 人 ”一 天 一 
0 V2T 


a 


1 


-2z?/24 
e rT. 
V2n 


e-® /2dz = 2/ T2m ， 
0 
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该 如 何 做 变量 替换 呢 ? 看 一 下 伽 马 函数 的 定义 , 我 们 发 现 它 有 一 项 是 e-*, 而 这 里 
的 指数 项 是 e-* /2. 这 意味 着 令 w= z2/2, 进而 有 z= (2)22, 所 以 


du 
2Z2m = 2mu™T, dz = 一 一 . 
V2u 
这 样 就 得 到 了 
m 三 一 一 u 二 u 24， 
2 2 0 2u VT 0 


我 们 使 用 一 种 很 棒 的 技巧 : 添加 0. 记 住 , 添加 0 是 最 强大 的 工具 之 一 
得 到 了 伽 马 函数 的 定义 , 但 是 还 需要 us-!, 而 目前 已 经 得 到 的 是 uw"3. 于 是 


1 下 
m—5 _ m+a—1 
1 2 一 人 2 ) 


这 意味 着 s = m 十 了. 现在 , 上 述 积分 就 是 T(m 十 3 了), 最 终 得 到 了 
KH2m 一 万 r (m+ 3) 

现在 , 我 们 明白 了 为 什么 前 面 有 个 如 果 : 虽然 弄 清 楚 了 这 些 矩 是 什么 , 但 你 要 
对 伽 马 函数 非常 了 解 , 否则 答案 看 起 来 没什么 用 . 例如 , 如 果 让 m = 0, 我 们 就 得 
到 了 曲线 下 方 的 面积 . 这 个 值 应 该 是 1, 而 公式 告诉 我 们 答案 是 2%T(1/2)Vx. 这 两 
个 结果 都 正确 , 因为 了 (1/2) = Vx. 事实 上 , 如 果 不 知 道 T(1/2) = Va 我 们 还 可 以 
使 用 极 坐 标 计算 技巧 来 得 到 这 个 重要 事实 的 另 一 种 证 明 ! 方差 是 多 少 呢 ? 这 要 求 
m = 1 ( 记 住 , 我 们 考察 的 是 2m 阶 窍 ). 此 时 , 我 们 有 21T(3/2)/ Va 以 及 (你 肯定 已 
经 猪 到 了 )T(3/2) = VR/2. 

伽 马 函 数 满足 很 多 漂亮 的 性 质 ， 在 15.2 节 中 , 我们 利用 分 部 积分 法 证 明了 
T(s+1l1) = sT(s) 至 少 在 s > 0 时 成 立 . 我 们 给 出 了 TUL/2) = Vz 的 几 个 证 明 . 作 
为 一 个 很 好 的 练习 , 利用 这 两 个 事实 去 证 明 T(m + 1/2) = 5D8T(1/2)， 从 而 有 
Ham = (2m 一 1)!l. 


15.7 分 布 族 


通过 介绍 所 有 不 同 的 重要 分 布 , 我 们 可 以 轻松 地 添加 更 多 章节 . 即使 仅 限 于 与 
伽 马 冰 数 有 关 的 分 布 , 仍然 可 以 有 更 多 章节 . 我 们 不 去 这 样 做 , 而 是 更 详细 地 讨论 
与 伽 马 函 数 有 关 的 一 个 分 布 ( 即 卡 方 分 布 , 第 16 章 的 主题 ), 并 在 这 里 给 出 简要 说 
明 . 


我 们 已 经 在 15.5 节 中 讨论 过 贝塔 分 布 . 现在 给 出 另外 两 族 概率 密度 函数 (我 们 
会 简单 解释 这 里 的 术语 ). 
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伽 马 分 布 与 韦 布 尔 分布 : 如 果 随 机 变量 X 的 概率 密度 函数 是 


1 


fu.s (x) = 人 TR)or™ 


0 


那么 X 就 服从 ( 正 ) 参数 为 k 和 o 的 伽 马 分 布 . 我 们 把 称 为 形状 参数 , o 称 为 
尺度 参数 , 并 记 作 对 ~~ 了 T(k,o) 或 和 ~ Gammal(k,o). 
如 果 随 机 变量 X 的 概率 密度 函数 是 


k,o lt 


{Woe 
“lo 


那么 X 就 服从 ( 正 ) 参数 为 k 和 o 的 韦 布尔 分 布 . 我 们 把 称 为 形状 参数 ,o 称 
为 尺度 参数 , 并 记 作 X ~ W(k,o). 


kle—z/o 若 Zz 2 0 


其 他 ， 


0) -le-(®/0)" 若 z S 0 


注意 , 这 两 个 分 布 具有 本 质 上 的 不 同 , 而 且 它们 与 贝塔 分 布 也 不 相同 . 这 三 个 


分 布 的 概率 密度 函数 都 包含 一 个 多 项 式 因子 ， 


布 还 包含 了 一 个 属于 [0,1] 且 不 为 0 
于 , 我 们 可 以 改变 参数 并 得 到 一 些 不 同 却 相关 的 分 布 . 这 样 就 引入 了 分 布 族 的 概念. 


这 些 分 布 的 概率 密度 函数 具有 不 同和 


后 , 我 们 试 


> 


晶 当 关 1 时 , 伽 马 分 布 与 韦 布尔 分 
的 (不 同 的 ) 指数 因子 . 这 些 分 布 的 特别 之 处 在 


的 参数 值 . 在 实践 中 , 我 们 通常 有 理由 相信 一 种 


自然 现象 或 数学 现象 可 以 通过 某 种 分 布 来 模拟 , 但 这 些 分 布 的 参数 值 是 未 知 的 . 然 


图 通过 数学 分 析 或 统计 推断 来 找 出 这 些 参数 的 值 . 


我 最 喜欢 的 例子 之 一 是 用 韦 布 尔 分 布 为 一 个 公式 提供 理论 依据 ， 这 个 公式 用 
来 预测 棒球 队 的 胜率 , 而 前 提 是 只 知 


实证 明 , 在 适当 的 参数 选择 下 , 
你 知道 的 分 布 越 多 ， 曾 


道 他 们 的 平均 得 分 和 场 均 得 分 (参阅 [Mil]). 事 


布尔 分 布 在 拟 合 得 分 与 数据 方面 做 得 非常 出 色 . 


文 , 这 是 基本 概率 与 数学 建 模 (以 及 


率 密度 函数 与 


ii 越 有 可 能 建立 这 样 的 联系 . 我 强烈 建议 你 读 一 读 这 篇 论 
一 些 初等 统计 ) 的 一 个 很 好 的 应 用 . 刚 开 始 , 我 
想 弄 清楚 如 果 得 分 服从 指数 分 布 (概率 密度 函数 与 e-* 成 正比 ) 和 瑞 利 分 布 ( 概 
zxe-* /2 成 正比 ), 结果 会 是 什么 样 的 . 我 是 从 物理 学 中 了 解 到 这 些 


分 布 的 , 并 知道 我 能 得 到 一 个 很 好 但 并 不 完美 的 答案 . 接 下 来 , 灵感 来 袭 : 我 注意 到 


这 两 个 概率 密度 函数 的 形式 都 是 ze 


-le-7 人 . 它们 属于 同一 族 分布 , 通过 选择 “ 恰 


当 的 ”k 和 和, 既 可 以 很 好 地 拟 合 现 实 世界 的 数据 , 又 能 得 到 数学 上 易于 处 理 的 积 


分 . 这 就 是 我 了 解 韦 布 尔 分 布 的 过 程 . 


韦 布尔 分 布 被 用 在 许多 涉及 生存 分 析 的 问题 上 , 贝塔 分 布 与 伽 马 分 布 也 有 类 似 


的 应 用 (多 


侍 基 百科 和 和 谷歌 会 迅速 给 


你 的 工具 越 多 , 你 做 的 建 模 就 越 好 . 


很 多 例子 )， 男 外 , 关键 是 要 时 刻 留意 分 布 族 . 
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15.8 ”附录 : 余 割 等 式 的 证 明 


书 中 通常 会 用 整 章 来 介绍 伽 马 函 数 所 满足 的 各 种 恒等式 ， 本 节 将 集中 讨论 一 
个 特别 适用 于 对 了 (1/2) 进行 研究 的 等 式 , 即 余 割 等 式 . 


余 割 等 式 : 如 果 s 不 是 整数 , 那么 


IT(s)T(1—s) = xcsc(xs) = 


元 
sin(TSs) 


在 证 明 这 一 点 之 前 , 我 们 花 点 时 间 用 这 个 等 式 来 完成 相关 研究 . 对 于 几乎 所 有 
的 s, 余 割 等 式 具 与 两 个 值 有 关 , 即 伽 马 函数 在 s 处 的 值 以 及 伽 马 函 数 在 1- s 处 
的 值 . 如 果 知 道 其 中 一 个 , 就 能 得 到 另 一 个 . 不 幸 的 是 , 这 意味 着 为 了 让 这 个 等 式 发 
挥 作用 , 至 少 要 知道 这 两 个 值 中 的 一 个 . 当然 , 除非 我 们 做 出 了 非常 特殊 的 选择 , 取 
s 二 1/2. 因为 1/2=1 一 1/2, 所 以 这 两 个 值 是 一 样 的 , 于 是 


Tt 
T(1/2)” = T(1/2)T(1/2) = sin(x/2) 一 

取 平 方 根 就 得 到 了 T(1/2) = VR. 我 们 很 幸运 , 这 个 非常 特殊 的 值 恰好 是 我 们 之 前 

想 要 的 ! 


在 下 面 的 小 节 中 , 我 会 给 出 关于 余 割 等 式 的 各 种 证 明 . 如 果 你 只 关心 如 何 使 用 
它 , 当然 可 以 跳 过 这 部 分 内 容 ; 但 是 , 如 果 继 续 读 下 去 , 你 就 会 了 解 人 们 是 如 何 得 出 
这 样 的 公式 的 , 以 及 他 们 是 如 何 证 明 这 些 公式 的 , 有 些 论述 比较 复杂 , 但 我 会 尽量 
出 我 们 为 什么 要 做 正在 做 的 事情 . 如 果 你 将 来 遇 到 这 样 的 情况 , 也 就 是 说 , 如 果 

你 是 第 一 个 面 对 该 问题 的 人 , 并 且 手 边 没有 任何 指导 材料 可 用 , 那么 就 有 了 可 以 展 
开 研 究 的 工具 . 
15.8.1 “” 余 割 等 式 : 第 一 种 证 明 

余 割 等 式 的 证 明 : 我 们 已 经 看 到 , 余 割 等 式 是 有 用 的 . 现在 来 看 一 下 它 的 证 明 . 
该 如 何 证 明 呢 ? 等 号 的 一 端 是 了 T(s)T(1 一 s). 这 两 个 数 都 可 以 用 积分 来 表示 . 所 以 
这 个 量 其 实 是 个 二 重 积 分 . 每 当 遇 到 二 重 积 分 时 , 都 应 该 考虑 使 用 变量 替换 或 者 交 
换 积 分 次 序 , 或 者 同时 使 用 两 者 ! 重点 是 , 积分 公式 是 我 们 的 起 点 . 这 种 论述 可 能 行 
不 通 , 却 值得 尝试 (在 很 多 数学 问题 中 , 最 困难 的 事情 之 一 就 是 弄 清楚 从 哪里 开始 ). 

我 们 要 写 的 东西 看 起 来 像 是 我 们 已 经 决定 要 做 的 , 但 是 这 里 有 两 个 微妙 的 错误 : 
IT(s)L(1—s)= 入 e Tr Idz ， 证 ex! sldz 


0 0 


一 > 


本 e ?7 1l.e rl sldz. (15.1) 
0 
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这 为 什么 是 错误 的 ? 第 一 个 表达 式 是 T(s) 的 积分 表示 , 第 二 个 表达 式 是 T(1-s) 的 
积分 表示 , 那么 它们 的 乘积 是 T(s)T(1 一 s), 接着 只 需要 把 这 些 项 合并 在 一 起 .…… : 
很 不 幸 , 这 是 错 的 ! 出 问题 的 地 方 是 , 在 两 个 积分 中 使 用 了 相同 的 虚拟 变量 . 我 们 
不 能 把 它 写 成 一 个 积分 两 个 积分 , 并 且 每 个 积分 都 包含 一 个 dz, 但 最 后 
只 得 到 了 一 个 dz. 这 是 学 生 最 常 犯 的 错误 之 一 . 由 于 两 个 积分 的 变量 没有 使 用 不 
同 的 字母 , 因此 我 们 不 小 心 将 它们 组 合 在 一 起 , 把 二 重 积分 变 成 了 一 重 积分 . 

应 该 使 用 两 个 不 同 的 字母 , 富有 创造 力 的 做 法 是 把 它们 表示 成 zx 和 y. 于 是 


T(s)LT(1— s) = so dz 人 e yy!' sldy 
0 0 


[ee OO 
二 / 站 er le yy sdzdy. 
=0 Jz=0 


虽然 我 们 正在 寻找 的 余 割 公式 很 美丽 也 很 重要 , 但 更 重要 (而 且 更 有 用 ! ) 的 


是 学 会 如 何 解决 这 样 的 问题 . 处 理 二 重 积分 的 方法 并 不 多 . 你 可 以 像 之 前 那样 求 积 
分 , 但 这 并 不 是 个 好 主意 , 因为 我 们 会 回 到 个 马 函数 的 乘积 . 现在 还 能 怎么 做 ? 可 以 
交换 积分 次 序 . 不 焉 的 是 , 这 也 没有 任何 帮助 . 具有 当 两 个 积分 变量 混合 在 一 起 时 ， 
交换 积分 次 序 才 有 帮助 , 但 现在 的 情况 并 非 如 此 . 这 两 个 变量 是 相互 独立 的 , 交换 
积分 次 序 并 没有 真正 改变 什么 . 只 剩 下 一 个 选择 : 做 变量 蔡 换 . 

这 是 证 明 中 最 难 的 部 分 . 我 们 必须 要 找到 一 种 合适 的 变量 蔡 换 . 看 看 第 一 种 可 
能 的 选择 . 我 们 有 zs -19 = (z/g)s 1971 (可 以 写成 (z/g)sz2 但 因为 伽 马 函数 的 
定义 中 涉及 一 个 变量 的 s 一 1 次 方 , 所 以 我 们 先 试 一 试 ). u = z/y 或 许 是 个 不 错 的 
变量 蔡 换 ? 如 果 是 这 样 的 话 , 我 们 就 要 固定 y, 然后 在 y 固定 的 前 提 下 , 令 w= z/y,， 
于 是 有 du = dz/y. 出 现 1/y 是 个 好 迹象 , 因为 我 们 之 前 还 有 一 个 y. 这 样 就 得 到 了 


T(s)T(1 — s) = j ea dy. 


现在 交换 积分 次 序 . 于 是 有 


加 
-大 则 下 
3 


| Oo s—1 
去 | du 
wo0 UV 二 +1 


—(ut+l)y 


a 
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警告 : 我 们 必须 非常 小 心 , 确保 交换 是 合理 的 . 还 记得 本 章 早 些 时 候 讨 论 过 确 
保 一 个 积分 有 意义 的 重要 性 吗 ? 上 面 的 被 积 函数 是 宅 工 . 如 果 这 个 积分 是 有 限 的 ， 
那么 当 w 一 co 时 被 积 函 数 必须 迅速 衰减 , 但 当 w 一 0 时 它 趋 近 于 无 穷 大 的 速度 也 
不 能 太 快 . 要 实现 这 一 点 , 必须 满足 s e (0,1). 如 果 s < 0, 那么 被 积 函 数 会 在 0 附 


近 快 速 趋 近 于 无 穷 大 , 但 如 果 s > 1, 被 积 函 数 在 无 穷 远 处 的 衰减 速度 又 不 够 快 . 
事后 看 来 , 这 个 限制 并 不 令 人 意外 , 实际 上 我 们 应 该 预料 到 这 一 点 . 为 什么 ? 还 
记得 我 们 在 前 面 的 证 明 中 说 过 式 (15.1) 中 有 两 个 错误 , 如 果真 的 够 警觉 的 话 , 你 可 


能 会 注意 到 我 们 只 提 到 了 一 个 错误 ! 被 遗 


的 积分 表示 , 但 它 仅 当 参 数 为 正 时 才 成 立 . 


局 的 错误 是 什么 ? 我 们 使 用 了 伽 马 函 数 
因此 , 我 们 需要 s>0 和 1-s>0, 这 两 


个 不 等 式 会 迫使 se (0,1). 如 果 这 次 没有 发 现 这 个 错误 , 也 不 要 担心 , 只 要 将 来 能 


ll 


意识 到 这 种 危险 就 够 了 . 这 是 (学 生 和 研究 人 员 ) 最 常 犯 的 错误 之 一 . 我 们 很 容易 
把 只 适用 于 茶 些 情形 的 公式 不 小 心 用 在 其 他 错误 的 地 方 . 


好 了 , 现在 把 考察 范围 限制 在 se (0,1) 上 . 我 们 把 下 面 这 个 问题 留 作 习题 . 证 


明 : 如 果 这 个 关系 式 在 s e (0,1) 时 成 立 , 那么 对 于 任意 的 s 该 关系 式 仍 成 立 . ( 提 
示 : 继续 使 用 伽 马 函数 的 函数 方程 .) 如 果 让 s 增加 1, 我 们 很 容易 看 到 csc(rs) 或 
sin(xs) 会 发 生 什 么 变化 . 至 于 伽 马 函 数 部 分 , 还 要 多 做 些 工 作 . 


现在 我 们 可 以 说 


rT(s)T(1— s) = 人/ 


Us-—1 


接 下 来 该 怎么 做 呢 ? 我 们 有 两 个 因子 : us-! 和 = 二. 注意 , 第 二 个 因子 看 起 来 像 是 


一 个 比值 为 -u 的 几何 级 数 和 . 为 了 看 清 这 一 点 , 我 们 把 -二 写成 二 志 ,而 后 者 
就 是 比值 为 -ua 的 几何 级 数 和 (只 要 |ul < 1)， 不 可 否认 , 刚 开始 我 们 并 不 能 明显 


地 识别 出 这 一 点 , 但 是 你 研究 的 数学 问题 越 多 、 经 验 越 丰 富 , 识别 规律 就 会 越 容易 . 


我 们 已 经 知道 2 ur = 二, 所 以 现在 只 


要 邻 7 = 一 wu 即 可 . 


我 们 必须 要 小 心 一 一 现在 又 要 犯 同样 的 错误 了 , 即 在 不 适用 的 情况 下 使 用 公 


式 . 我 们 很 容易 掉 进 这 个 陷阱 . 地 运 的 是 ,有 利 


方法 可 以 绕 过 它 . 我 们 把 积分 划分 


成 两 部 分 , 第 一 部 分 是 ve [0,1], 第 二 部 分 是 ve [1, oo]. 在 第 二 部 分 中 , 我 们 要 做 
变量 替换 v = 1/u, 并 进行 几何 级 数 展开 . 拆 分 积分 是 另 一 种 需要 掌握 的 有 用 技巧 . 
利用 这 种 技巧 , 可 以 把 一 个 复杂 的 问题 分 解 成 较 简 单 的 问题 , 而 这 些 较 简单 的 问题 
有 更 多 方法 来 解决 . 在 寻找 泰勒 级 数 的 展开 时 , 我 们 就 需要 做 一 些 类 似 的 事情 . 我 


们 想 摆脱 无 穷 大 , 并 用 已 知 的 东西 来 奉 换 它 . 


对 于 第 二 个 积分 , 我 们 会 做 变量 替换 v = 1/wu. 这 样 就 得 到 了 dv = 一 du/w? 或 
du 二 一 v2dv (因为 1/u2 = 2), 而 积分 上 下 限 也 从 v :1 一 oo 变 成 了 v:1 一 0 ( 然 


得 到 了 


后 , 我 们 会 使 用 负 号 将 积分 上 下 限 切 换 到 更 常 


见 的 v:0 一 1). 继续 进行 下 去 , 我 们 
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Ws- 


d 


du 


UU 二 +l 
| 


Ce 
w+ f 
1 


ut+1l 


d 
ut+l ” 
Ee 


du 


(1/v)*™ 2 
CA 于 了 vdv 


f 


—58 


v 


UU 二 +l 


注意 这 两 个 表达 式 有 多 相似 (并 有 
几何 级 数 公式 , 然后 交换 积分 与 求 和 的 次 序 . 


-f 


dw. 
v 十 1 G 


在 s = 1/2 的 特殊 值 处 也 是 相同 的 ). 现在 使 用 


因为 se (0,1), 所 以 一 切 都 是 合理 的 


(参见 B.2 节 ). 因此 , 所 有 积分 都 存在 且 有 具有 


好 的 性 质 . 于 


让 


1 Oo 于 Co 
T(s)T(1— s) =/ wt Dlrdut / oo (lw"dy 
0 n=0 0 m=0 
Oo Oo 1 
一 > / us lindu >》 ( ye v™ dv 
v0 0 7 一 0 0 
6 stn 1 00 1 十 1 一 S 1 
= 1 | 1 
( nn 二 slo > 7 十 1 一 5io0 
n=0 m0 
= 1 1 
= 1)” | 1)™ 
二 ) ns 之 ) 7 十 1 一 5 


注意 , 我 们 用 了 两 个 字母 来 计算 不 同 的 和 . 虽然 字母 n 可 以 使 


两 次 , 但 使 用 不 同 


的 字母 是 个 好 习惯 . 现在 的 情况 是 , 我 们 将 对 计数 进行 调整 , 以 便 轻松 地 把 它们 组 


合 在 一 起 . 


这 两 个 和 看 起 来 非常 相似 , 都 像 是 -1 的 方 协 除 以 十 s 或 一 s. 我 们 把 这 两 


个 和 改写 成 用 大 来 描述 的 形式 . 第 


个 和 有 个 额外 项 , 我 们 会 把 它 提 出 来 . 在 第 


个 和 中 , 我 们 令 天 = n; 在 第 二 个 和 中 , 我 们 令 =m 十 1 (所 以 (-1)” 就 变 成 了 


= 


(D1=(-1)*+1), 于 是 


rard s) = 2 ee 2 De 
> es 
-1 
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虽然 看 起 来 不 像 , 但 我 们 刚刚 完成 了 证 明 ， 关 键 在 于 , 要 认识 到 上 面 的 式 子 就 是 
rcsc(rs) = x/ sin(xs). 这 一 点 通常 会 在 复 分 析 课 上 得 到 证 明 , 例子 请 参阅 [S52]. 
现在 至 少 可 以 看 到 这 是 合理 的 . 我 们 断言 


区 本 人 25 
sin(xs) 5 2 和 K2 一 52 
如 果 s 是 整数 , 那么 sin(rs) = 0, 因此 左 端 是 无 穷 大 的 , 而 右 端 恰 有 一 项 会 趋 近 于 
无 穷 大 . 这 至 少 说 明了 我 们 的 答案 是 合理 的 , 或 者 几乎 是 合理 的 . 这 个 和 看 起 来 很 
像 o/ sin(ro, 其 中 e 是 常数 , 但 我 们 并 不 清楚 e 是 否 等 于 r. 幸运 的 是 , 有 种 方法 
可 以 解决 这 个 问题 , 但 这 需要 我 们 更 多 地 了 解 某 些 特定 和 . 如 果 令 s = 1/2, 那么 这 
个 和 就 变 成 了 
i 

172 2_(-1" 直 一 pp 2 及 一 174 


Ee=1 k=1 


一 2 I (—1)* 
EE: (2k — 1)(2k+1) 


加 1/ 1 1 
人 42 2 2k—1 2k+1 


由 于 奇数 倒数 的 交替 和 为 x/4, 因此 证 明了 常数 c 等 于 x 我们 利用 x 的 格雷 戈 
里 - 莱 布 尼 兹 公式 , 这 样 就 完成 了 分 析 (关于 如 何 证 明 这 一 点 , 请 参阅 习题 15.10.21). 
注 虽然 这 个 证 明 很 长 , 但 其 中 有 很 多 好 的 想法 . 最 后 , 我 们 试 着 通过 观察 特 
殊 值 来 验证 该 公式 的 合理 性 . 这 是 个 不 错 的 主意 , 但 也 只 是 寻找 特殊 值 而 已 . 利用 
格雷 站 里 - 莱 布 尼 诊 公式 , 我 们 可 以 验证 s = 1/2 时 的 结论 . 很 幸运 , 这 恰好 是 我 们 
最 关心 的 s 值 ! 
15.8.2 ” 余 割 等 式 : 第 二 种 证 明 
我 们 已 经 证 明了 关于 个 马 函数 的 余 割 等 式 , 为 什么 还 需要 另 一 种 证 明 呢 ? 对 我 
们 来 说 , 主要 原因 是 教育 意义 . 本 书 的 目的 不 是 教 你 如 何 回答 生活 中 的 某 个 特定 问 
题 , 而 是 提供 工具 来 解决 可 能 遇 到 的 各 种 新 间 题 . 基于 这 个 原因 , 我 们 有 必要 多 看 
几 种 证 明 , 因为 不 同 的 方法 强调 了 问题 的 不 同方 面 , 或 者 能 更 好 地 推广 到 其 他 问题 . 
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现在 回 到 前 面 . 我 们 有 se (0,1), 以 及 


TIT(s)I(1— s) = 人 i e yy sldy 
0 0 


CO CO 
= [ er le yy sdzdy. 
y=0 J z=0 


我 们 已 经 讨论 过 这 里 的 选择 . 现在 不 能 直接 求 积分 , 不 然 这 会 重新 得 到 两 个 伽 马 函 
数 . 我 们 也 不 能 改变 积分 次 序 , 因为 变量 zx 和 y 是 彼此 独立 的 , 所 以 改变 积分 次 序 
并 不 能 真正 解决 问题 . 唯一 能 做 的 就 是 变量 替换 . 

之 前 的 做 法 是 令 v = xz/y. 这 是 因为 我 们 看 到 了 zx-1y-s = (z/y)s-1y-1, 所 以 
设 定 wu = z/y 并 非 不 合理 . 还 有 其 他 “好 的 ” 变量 替换 吗 ? 有 , 如 果 你 看 不 到 这 种 
赫 换 , 也 并 不 奇怪 . 这 就 是 我 们 的 老 朋 友 , 极 坐 标 变换 . 

在 这 里 使 用 极 坐 标 似乎 有 点 奇怪 . 毕竟 , 极 坐标 常用 来 解决 径 向 和 角 对 称 的 问 
题 . 我 们 也 会 用 极 坐 标 来 计算 圆 域 上 的 积分 . 但 这 些 情况 都 没有 发 生 ! 尽管 如 此 , 现 
在 尝试 一 下 极 坐标 技巧 也 是 种 不 错 的 做 法 . 

。 首先 , 我 们 没有 看 到 很 多 变量 替换 , 但 是 知道 极 坐 标 , 所 以 不 妨 试 一 试 . 

。 其 次 , 我 们 想 证 明 答 案 就 是 rcsc(rs) = A/ sin(rs). 管 案 涉 及 正弦 函数 , 所 以 

0 应 该 尝试 一 下 极 坐 标 . 
一 种 方法 要 么 可 行 , 要 么 不 可 行 . 希望 上 述 内 容 至 少 能 让 你 明白 我 们 为 
ee 试 , 并 可 以 在 将 来 为 你 提供 指导 . 
回顾 一 下 极 坐 标 , 能 得 到 以 下 关系 : 


T= rcos0, YY = rsing, dzxdy = 7d7d0. 


积分 上 下 限 是 什么 ? 我 们 的 积分 区 域 是 右上 象限 , 即 xz,y : 0 一 co. 在 极 坐标 中 , 该 
积分 区 域 就 变 成 了 r :0 一 oo 且 0:0 一 /2. 现在 , 积分 变 成 了 


工 /2 
ra-a=- 人 . eeos0 le "sl(rsing) “rdrdo 
0 一 7 一 0 


Tz/2 foo 
@—"(cos 0+sin 0) (人 1 -~ drdb 
r=0 sin0 Sin 0 


cosbNs 1 Pen Pe 
errtcosb+sinb)dr| dg 
sin 0 sing0 | /=-o0 


/2 s—1 一 r(cos 0 二 sin 0) ] 29 
(只 本 | e dg 
0 


| 


Sin 0 cos0++sing 


d0. 


cosO\”! 1 1 
sin0 cos0++sing 
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现在 看 起 来 并 没有 取得 很 大 的 进展 , 但 我 们 只 做 了 简单 的 变量 替换 , 问题 就 大 
大 简化 了 . 值得 注意 的 是 , 很 多 被 积 函数 只 依赖 于 cosb/sin0 = ctan9 ( 即 9 的 余 
切 ). 如 果 做 变量 替换 = ctanb, 那么 du = -csc20 = -1/sin20. 如果 不 记得 这 个 
公式 , 可 以 利用 商 的 求 导 法 则 来 得 到 它 : 


、 /10 ， i 
二 (各) _ cos' gsing 二 0cosb 
SinO sin20 
一 sin20 一 cos20 | 1 
sin20 sin20 


现在 的 情况 看 起 来 真 的 很 乐观 : 我 们 想 要 的 变量 替换 中 要 有 1/ sin? 9, 而 被 积 函数 
中 已 经 有 一 个 1/ sin9 了 . 现在 利用 下 面 的 式 子 来 得 到 另 一 个 1/ sin b: 


1 1 1 1 1 


cos0+sing sing(cos0/sin0)+1 sinctan0+1 


接 下 来 要 做 的 就 是 确定 积分 上 下 限 . 如 果 w= ctanb = cosb/ sinb, 那么 9:0 一 7/2 
就 对 应 于 wu : oo 一 0 (不 需要 担心 积分 方向 是 从 oo 到 0 一 一 这 里 有 个 负 号 , 它 会 改 
变 积分 方向 ). 

综 上 所 述 , 我 们 有 


/2 s—1 dg 
rr -= 人 ctans -0 
bg-0 ctan0 十 1 sin20 


0 5 一 1 co ,,s—1 
u u 
sri | TIT 


这 个 积分 看 起 来 应 该 很 熟悉 一 一 这 正 是 我 们 在 上 一 节 中 看 到 的 积分 ， 即 式 
(15.2). 因此 , 从 现在 开始 , 可 以 按照 上 一 节 的 步骤 进行 操作 . 

注 ”很 多 学 生 第 一 次 看 到 较 难 的 数学 题 时 会 感到 害怕 .为 什么 不 同 的 学 生 会 
有 相同 的 问题 :“ 我 不 知道 从 哪里 入 手 .” 对 那些 有 这 种 感觉 的 人 来 说 , 应 该 能 在 此 
找到 安慰 . 这 里 (至 少 ! ) 有 两 种 可 以 解决 问题 的 变量 替换 . 在 学 习 数 学 的 过 程 中 ， 
你 会 不 断 地 看 到 有 很 多 不 同 的 方法 可 以 解决 问题 . 不 要 害怕 尝试 一 些 东 西 . 使 用 它 
一 段 时 间 , 看 看 它 是 如 何 运 作 的 . 如 果 行 不 通 的 话 , 还 可 以 回 过 头 来 重新 尝试 其 他 
方法 . 


15.8.3 ” 余 割 等 式 : s = 1/2 的 特殊 情形 

显然 , 我 们 想 证 明 任 意 s 的 余 割 公式 , 但 最 重要 的 一 种 情况 是 s = 1/2. 我 们 要 
利用 T(1/2) 写 出 正 态 分 布 的 概率 密度 函数 , 并 算出 它 的 矩 . 所 以 , 虽然 得 到 对 任何 
s 均 成 立 的 公式 很 好 , 但 是 如 果 只 能 处 理 s = 1/2 的 情形 也 仍然 值得 庆祝 . 


mh 


428 第 15 章 伽 马 函 数 与 相关 分 布 


回忆 一 下 , 在 式 (15.2) 中 我 们 证 明了 


ws-—1 


TIT(s)I(1—s) = es 一 -一 du. 


ut+l 


令 s==1/2 则 有 


ce ， 一 1/2 
T(1/2)2 = [ ”du 
0 


工 十 信 
为 了 解决 这 个 问题 , 我 们 将 使 用 个 很 难 想到 的 变量 蔡 换 a 看 看 它 
是 如 何 工作 的 ， 然后 讨 从 为 什么 这 是 一 个 合理 的 尝试 . 这 个 变量 替换 是 : 令 凡 =? 


所 以 z= /2 且 dz = du/2Vu. 请 注意 这 与 我 们 的 积分 是 多 么 吻合 . 我 们 已 经 有 了 
u-1/2dwu 这 一 项 , 它 会 变 成 2dz. 将 其 代入 原 式 可 得 


2 2dz 2 dy 
看 到 这 个 积分 , 你 应 该 会 想到 微 积 分 中 的 三 角 变换 . 只 要 看 到 1 - z2, 就 应 该 想到 试 
一 试 z 二 sin9 或 者 z = cos9; 当 看 到 1 十 zz? 时, 你 应 该 想到 > = tan0. 现在 就 来 做 
这 种 变量 替换 . 三 角 变 换 之 所 以 如 此 有 用 , 是 因为 把 毕 达 哥 拉 斯 公式 


sin20 二 cos20 = 1 
两 端 同时 除 以 cos? 9, 则 有 
1 
2 2 
tan“0 十 1 = 21 = sec” 0. 


令 z= tan9 意味 着 1 + zz? 被 替换 成 了 sec2 0. 另外 , dz = sec? 9d9 (如 果 不 记得 这 
个 结果 , 你 只 需要 对 tang = sin 0/ cos9 使 用 商 的 求 导 法 则 即 可 ). 因为 > : 0 一 co， 
所 以 9:0 一 zx/2. 综 上 所 述 , 我 们 有 


2 We 动 2 
IT(1/2)” =2 、 :证 sec” 0d0 


当 T(1/2)? = 7 时 ,TT(1/2) = VE 

我 们 得 到 了 一 个 关于 T(1/2) = V7 的 正确 且 初 等 的 证 明 . 你 应 该 能 够 逐 行 读 
懂 这 个 证 明 , 但 这 并 不 是 数学 的 重点 . 关键 是 要 明白 作者 为 什么 要 选择 这 些 步 骤 ， 
这 样 你 也 可 以 给 出 类 似 的 证 明 . 

这 里 做 了 两 次 变量 替换 . 第 一 次 是 把 v 替换 成 22, 第 二 次 是 把 z 替换 成 tan 0. 
这 两 次 变换 是 相关 的 . 怎么 会 有 人 想到 这 些 ? 老实 说 , 在 写本 章 的 时 候 , 我 不 得 不 
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查阅 几 年 前 兽 教 过 的 类 似 课程 的 笔记 . 我 记得 不 知 何故 把 正切 引入 到 了 问题 中 , 但 
不 记得 很 久 以 前 使 用 的 具体 技巧 . 想到 这 一 点 并 不 容易 ,需要 花费 很 多 时 间 , 但 你 
解决 的 问题 越 多 , 能 发 现 的 规律 也 就 越 多 . 分 母 中 有 一 个 1 十 ww 我 们 还 知道 如 何 利 
用 三 角 变 换 来 处 理 诸如 1+ z? 这 样 的 项 . 余 割 等 式 中 涉及 三 角 函 数 , 这 就 意味 着 三 
角 变 换 应 该 是 一 种 可 行 的 方法 . 这 种 做 法 不 一 定 成 功 , 但 不 妨 试 一 试 , 看 看 利用 它 
可 以 推出 哪些 内 容 . 

伴随 独 我 们 的 成 功 , 接 下 来 要 做 的 事情 自然 是 对 一 般 的 s 进行 这 样 的 蔡 换 . 如 
果 这 样 做 的 话 , 就 有 


Ooe 225 一 2 


T(s)T(1L 一 s) 三 | 一 一 一 2zdz 


1 十 22 


ce ,2s—1 
=2] 二 dz 
0 1 工 十 22 


T/2 2s-10 
一 2 2 可 sec2 0d0 
0 Sec2 0 


x/2 
二 2 tan2s-10d0. 
0 


现在 看 一 看 s = 1/2 有 多 么 特别. 当 s= 1/2 时 , 而 且 仅 当 s = 1/2 时 , 被 积 函数 才 
会 退化 成 常数 函数 1, 这 样 就 能 轻松 地 求 出 积分 值 . 当 s 取 其 他 任何 值 时 , 都 必须 计 
算 正切 函数 的 暴 积 分 , 这 不 是 件 容易 的 事 ! 但 这 样 的 公式 确实 存在 , 例如 ， 


f an 0d0 = 3 | 一 2arctan(1 — V2Vtan 0) 十 2arctan(1 十 V2vVtan 0) 


+ log (1 — V2Vtanb + tan0) — log (1 + V2Vtan9 + tanO)|. 
注 ”如果 知道 arctan (z) 的 导数 是 于 5, 就 没 必要 做 z = tan0 这 个 变量 替换 ， 
而 是 可 以 直接 求 出 fe Tdz 等 于 arctan (co) 一 arctan (0) = nx/2. 要 想 看 到 这 一 
点 ,最 好 的 一 种 方法 是 注意 到 当 f(g(x)) = zz 时 , 由 链 式 法 则 可 得 f(g(x))g (x) = 1， 
或 者 yz) = 1/P(g(z)) 把 这 个 结果 应 用 于 g(z) = aretan(z) 和 f(z) = tan(z), 就 
能 求 出 arctan(z)] 的 导数 . 这 里 的 难点 在 于 , 画 出 正确 的 直角 三 角形 来 得 到 fr(g(z)) 
的 漂亮 表达 式 . 
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本 音 讲 的 是 伽 马 函数 及 其 相关 分 布 . 乍 一 看 , 最 后 一 节 似 乎 与 本 章 的 主题 没 什 
么 联系 , 但 利用 s = 1/2 的 余 割 等 式 , 马上 就 能 求 出 该 分 布 的 标准 化 常数 . 特别 是 ， 
我 们 曾 在 15.8.3 节 中 讨论 过 这 个 积分 . 
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那么 X 就 服从 标准 柯 西 分 布 . X 的 均值 不 存在 且 方 差 为 无 穷 大 . 
正如 之 前 所 说 , 15.8.3 节 计 算 了 该 分 布 的 标准 化 常数 . 对 该 计算 的 另 一 种 解释 
是 1/(+z2) 的 原 函 数 是 arctan(z), 于 是 


”dz ”dz 区 
[1 一 2 TE 一 2 [arctan (co) — arctan (0)] 一 2|5 -0| 三 2 


因此 , 为 了 使 积分 值 为 1 上 式 必 须要 乘 以 1/r. 
柯 西 分 布 为 什么 没有 均值 ? 我 们 不 是 应 该 考察 


dz 
a 
吗 ? 奇 函数 在 对 称 区 间 上 的 积分 不 应 该 等 于 0 吗 ? 与 往常 一 样 , 出 问题 的 地 方 与 无 
穷 大 有 关 一 一 当 涉 及 无 穷 大 时 , 你 一 定 要 非常 小 心 . 正确 说 法 是 这 样 的 : 这 种 反常 
可 分 存在 , 当 且 仅 当 


3 dz 
Pe a + 2) 
存在 , 而 且 无 论 4, B 以 何 种 方式 趋 近 于 无 穷 大 , 上 述 积分 值 保持 不 变 . 不 幸 的 是 ， 
在 我 们 的 例子 中 , 积分 值 与 4, B 趋 近 于 无 穷 大 的 方式 有 关 . 例如 , 如 果 B = 4, 那 
么 积分 值 是 0, 但 当 B = 24 时 , 从 -4 到 4 的 积分 值 为 0, 这样 就 得 到 了 


2 dz 24 ydz 

加 | 起 人 证 河 
当 4 较 大 时 ，z/(L + 地) 近似 于 1/z (更 精确 的 说 法 是 , z/(1+ z2) 大 于 等 于 1/2z， 
目 小 于 等 于 1/z), 那么 积分 值 就 近似 于 


24 
dr _1 _ log(2) 
dim, 和 元 Dog(24) — log(A)] 二 


因此 , 均值 的 积分 与 趋 近 于 无 穷 大 的 路 径 有 关 , 所 以 均值 不 存在 (请 参阅 习题 15.10.23). 
方差 的 情况 更 糟 , 它 显 然 是 无 穷 大 . 注意 , 当 x > 2016 时 , 我 们 有 zx?2/(1 十 x?) 之 
1/2, 从 而 有 
2 dz de 
/ (1 十 2Z2) 人 Se. 


柯 西 分 布 是 最 重要 的 分 布 之 一 , 你 必须 掌握 并 记 住 它 . 因为 服从 柯 西 分 布 的 随 
机 变量 没有 均值 且 方 差 为 无 穷 大 , 所 以 其 性 质 与 我 们 研究 过 的 其 他 随机 变量 有 很 大 
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不 同 . 因此 , 如 果 想 知道 一 个 结果 是 否 适 用 于 所 有 的 概率 密度 函数 , 那么 用 柯 西 分 


想 是 个 不 错 的 选择 . 


布 或 者 “更 好 ”的 分 布 (比如 均匀 分 布 、 指 数 分 布 、 高 斯 分 布 .……… ) 来 验证 你 的 猜 


柯 西 分 布 在 一 些 经 济 学 理论 中 也 起 着 重要 的 作用 . 随机 游 走 假设 的 一 个 简单 
变 体 断 言 , 股价 运动 可 以 通过 抛掷 相互 独立 的 硬币 来 很 好 地 模拟 , 这 样 就 导致 了 中 


心 极限 定理 和 高 斯 特性 的 出 现 . 然而 , 数据 表明 , 存在 比 该 理论 所 预测 的 更 大 的 波 


动 天 数 , 并 且 需 要 使 用 比 高 斯 分 布 方差 更 大 的 分 布 . 事实 证 明 , 柯 西 分 布 和 高 斯 分 


布 可 以 放 在 同一 个 具有 不 同 参 数 的 族 中 . 有 趣 的 是 , 两 者 
15.10.22). 有 关 这 些 应 用 的 更 多 信息 , 请 参 
Man, ManHul. 


15.10 习 题 


习题 15.10.1 求 T(3/2). 
习题 15.10.2 ” 求 T(-1/2). 


都 是 稳定 分 布 (参见 习题 


蜀 Fama 和 Mandelbrot 的 著作 [Fal, Fa2， 


习题 15.10.3 ”证 明 : T(m 十 1/2) = #2 了 T(1/2), 从 而 有 jom = (2m 一 11. 


习题 15.10.4。” 设 m 是 正 整数 , 求 (1/2 一 m). 
习题 15.10.5 ”证 明 : 如果 关系 式 PT(s)T(1 一 s) = mcsc(mrs) 对 


任意 值 时 , 该 式 仍 成 立 . (或 者 至 少 对 所 有 非 整数 的 s 成 立 . 


解释 两 个 无 穷 大 相等 .) 
习题 15.10.6 ”a,b 取 何 值 时 , 贝塔 分 布 会 关于 均值 对 称 ? 
习题 15.10.7 ” 求 贝塔 分 布 的 均值 . 
习题 15.10.8 ” 求 韦 布尔 分 布 的 均值 . 
习题 15.10.9 ” 求 参 数 为 和 o 的 伽 马 分 布 的 均值 . 
习题 15.10.10 ” 求 参 数 为 k 和 c 的 伽 马 分 布 的 方差 . 


s € (0,1) 成 立 , 那么 当 s 取 
如 果 s 是 个 整数 , 我 们 必须 


习题 15.10.11 ” 设 随机 变量 X 服从 参数 为 k 和 o 的 伽 马 分 布 , 计算 E[X"]. 
习题 15.10.12 ”对 伽 马 分 布 与 爱 尔 衣 分 布 之 间 的 关系 进行 评论 . 


习题 15.10.13 ”对 于 参数 为 k 和 0 的 伽 马 分 布 , 它 能 取 到 的 最 大 值 x 是 多 少 ? 试 着 用 它 来 


估算 nl. 


习题 15.10.14 。 设 Xi Xo2，… ,Xk 是 n 个 独立 同 分 布 的 随机 变量 , 它们 的 概率 密度 函数 均 
为 f, 累积 分 布 函数 为 FF. 证 明 : 在 这 nn 个 变量 中 , 第 天 小 的 随机 变量 是 


习题 15.10.15 “利用 上 一 题 的 公式 证 明 : 对 于 nn 个 服从 (0,1) 上 均匀 分 布 的 随机 变量 , 第 天 
小 的 随机 变量 可 以 用 贝塔 分 布 来 模拟 . 求 出 这 个 贝塔 分 布 的 合适 参数 . 
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习题 15.10.16 


求 出 从 y(s,z) 到 xy(s 一 1z) 的 递 
习题 15.10.17 ”通过 计算 ,1 给 来 证 


低 阶 不 完整 伽 马 函数 的 定义 是 


7T(s5,Z) = / e “x ldz. 
0 


明 x 的 格雷 戈 里 - 莱 布 尼 兹 公式 ， 这 里 有 
几何 级 数 公式 展开 ,交换 求 和 与 求 积 分 的 次 序 , 以 及 逐 项 积分 
导数 是 1/(1 二 x2). 


指数 分 布 具有 


.特别 是 , 第 个 人 的 联网 时 刻 色 


法 : (1) 使 ) 
都 必须 是 合理 的 ); (2) 利用 arctanz 芯 
习题 15.10.18 ”因为 伽 马 分 布 与 指数 分 布 有 关 , 并 
分 布 在 测量 网 络 服务 器 的 流量 方面 很 才 
来 模拟 , 其 中 形状 参数 是 k, 尺度 参数 为 a. 如 
小 时 内 联网 的 概率 . 
习题 15.10.19 ”风速 可 以 用 韦 布尔 分 布 来 很 好 地 近似 .假设 某 给 定 
数 为 2 且 尺 度 参数 为 10 的 
习题 15.10.20 
区 域 涂 上 阴影 . (有 几 种 方法 可 以 做 到 这 一 点 , 有 些 方 沪 
习题 15.10.21 “证明 格 雷 戈 里 - 莱 布 尼 兹 公式 . (提示 : 利 


到 让 zdz 二 3 把 11 


二 z. 验证 
15.10.22 


那么 说 X 


+- 2? 写成 1 一 (x?), 并 利 
“交换 求 和 与 求 积分 的 次 序 ” 以 及 “ 逐 


7 = 二 一 x? 的 几 
页 积分 ”的 合理 性 ， 


区 域 的 风速 服从 
布尔 分 布 , 求 出 风速 超过 20 的 概率 . 
画 出 a = 2, = 3 的 贝塔 分 布 . 把 曲线 下 方 与 P(0.2 < X < 0.6) 相对 应 的 
看 起 来 更 好 . 试 着 去 做 一 下 .) 

arctan (x) 的 导数 是 TH 来 得 


可 级 数 公式 展开 


种 方 
所 有 这 些 


“无 记忆 性 ”, 所 以 伽 马 
用 伽 马 分 布 
果 o = 1/10, 求 出 第 100 个 人 


在 开始 后 1 


pA 
状 参 


如 果 随 机 变量 X 的 概率 密度 函数 是 


fx(x) = 


他 教材 使 用 


Cauchy(a2,b2)， 那么 存在 常数 a3,bs 使 得 X 十 Y ~ Cauchy(as,bs)， 

分布 是 稳定 的 . (警告 : 如 果 你 不 了 解 复 分 析 , 入 
道 留 数 定理 , 就 可 以 给 出 一 个 简单 的 论证 .) 
设 X ~ Cauchy(a,b) (参见 上 一 题 ). 虽然 X 不 存在 均值 , 但 
位 数 £ 是 满足 下 面 这 个 式 子 的 什 


来 表示 a3,b3. 因此 , 柯 
有 挑战 性 的 练习 ; 如 果 知 


1 15.10.23 


A 
疯 


其 中 ,b> 


] a 和 5b 来 表示 
15.10.24 ”把 习题 15.10.22 


的 符号 咯 有 不 同 ,所 以 要 


1 


1 


x 


0 L 


bx 1 + (x — a)?2/b2 


服从 参数 为 a 和 5 的 广义 柯 西 分 布 , 并 记 作 X ~ Cauchy(a,0b) (注意 
小 心 )， 证 明 : 如 果 X ~ Cauchy(ai,b1)， 


保持 微笑 ! ) 


一 


7 人 


al, Q2, b1, b2 
了 么 这 将 是 个 很 


已 有 中 位 数 . 中 


人 jx(z)dz = fx (zx)dz. 


位 数 . 


住 广 到 


及. (警告 : 如 果 


\ 利 


如 C(a, 有)AETIz 一 aol/o) 的 概率 密度 函数 上 ， 
] 复 分析 知识 , 这 道 题 会 非常 难 .) 
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卡 方 分 布 是 统计 学 中 最 重要 的 分 布 之 一 . 它 总 是 在 假设 检验 中 出 现 ， 定 义 
如 下 . 
卡 方 分 布 : 如 果 随 机 变量 X 服从 自由 度 为 v > 0 的 卡 方 分 布 , 那么 X 的 概率 密 
度 函 数 为 ] 
f(z) = | 27/2T(v /2) 
0 
我 们 将 其 记 作 X ~ x?2(v). 
这 个 概率 密度 函数 显然 是 非 负 的 , 但 它 的 积分 值 是 否 为 1? 在 求 积 分 之 前 , 回 
忆 一 下 伽 马 函 数 的 定义 (关于 该 函数 的 详细 介绍 , 请 参阅 第 15 章 ): 


T(s) 和 etts—1dt. 
0 


因为 概率 密度 函数 中 包含 一 个 (wv/2), 所 以 伽 马 函数 在 理解 卡 方 分 布 方面 发 挥 了 
重要 的 作用 , 这 一 点 也 不 奇怪 . 
现在 来 求 积 分 : 


v/2—1 -7z/2g 至 一 2Z/2 Z/2-1d 
/ 27T]2) ”TCM 0 


ZL2 一 1)e-z/2 若 zx > 0 
其 他 . 


他 


注意 这 个 积分 与 伽 马 函 数 的 定义 有 多 相似 . 唯一 的 区 别 是 , 这 里 有 一 xz/2 的 指数 , 但 
在 伽 马 函 数 的 定义 中 只 有 一 zx. 这 意味 着 我 们 可 以 做 变量 替换 上 = z/2, 于 是 z = 2t 
且 dz = 2dt. 这样 就 得 到 了 


v/2-1le-z/2d7 一 ~- -t(2t)"/2-12dt 
人 
9v/2 oo 
Ee tt"/271dt 
| 
272T(y/2) 
~ 27/2T(v/2) 


我 们 证 明了 它 是 一 个 概率 分 布 . 
下 节 将 讨论 卡 方 分 布 是 怎么 来 的 , 然后 继续 对 其 部 分 性 质 和 应 用 进行 总 结 . 不 
过 , 在 此 之 前 有 必要 阐述 一 下 术语 的 选择 . 每 选择 一 个 > > 0, 我 们 都 会 得 到 一 个 不 
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同 的 分 布 . 下 面 可 以 看 到 , v 取 正 整数 时 的 情形 是 最 重要 的 . 我 们 需要 引用 这 个 参 
数 , 约定 的 做 法 是 把 > 称 为 ( 卡 方 分 布 的 ) 自 由 度 . 卡 方 分 布 的 自由 度 是 非常 重要 的 ， 
因为 它 极 大 地 改变 了 分 布 的 形状 , 如 图 16-1 所 示 . 


0.5 


图 16-1 ve {1,2,3,5,10,20} 的 卡 方 分 布 . 随 着 自由 度 的 增加 , 凸 起 的 位 置 会 回 右 移动 


自由 度 的 正式 定义 为 统计 学 中 可 以 自由 变化 的 数值 个 数 . 如 果 有 个 观测 值 ， 
那么 自由 度 通常 是 N - 1 或 NW. 关于 这 个 概念 的 更 多 信息 , 请 参阅 习题 16.5.21. 

在 统计 学 中 , 很 多 假设 检验 的 检验 统计 量 在 原 假设 下 服从 卡 方 分 布 . 这 种 检验 
统计 量 服从 卡 方 分 布 的 假设 检验 适用 于 分 类 数据 卡 方 检验 的 优点 是 它 是 一 个 非 
参数 检验 . 具体 地 说 , 这 意味 着 它 对 提取 数据 的 基本 总 体 分 布 没 有 任何 假设 . 它 的 
缺陷 要 比 其 他 参数 检验 的 统计 效果 差 . 


16.1 卡 方 分 布 的 起 源 


当然 , 虽然 可 以 把 任何 积分 值 为 1 的 非 负 函 数 看 作 概 率 密度 函数 , 但 其 中 大 部 
分 都 没有 研究 价值 . 为 什么 卡 方 分 布 如 此 重要 呢 ? 原因 在 于 卡 方 分 布 是 由 相互 独立 
且 均 服从 正 态 分 布 的 随机 变量 之 和 构成 的 . 
设 和 ~ N(0,1), 这 意味 着 X 是 一 个 服从 标准 正 态 分 布 的 随机 变量 (参见 第 14 
. 因此 , X 服从 均值 为 0 且 方 差 为 1 的 高 斯 分 布 . 下 面 给 出 一 个 重要 结果 . 


i 


草 


so 


卡 方 分 布 与 正 态 分 布 之 间 的 关联 : 如 果 和 ~ N(0,1), 那么 X2 ~ x2(1). 


这 只 是 冰山 一 角 , 我 们 很 快 会 看 到 一 个 大 规模 的 推广 . 但 是 , 现在 先 来 证 明 标 
准 正 态 分 布 的 平方 是 自由 度 为 1 的 卡 方 分 布 . 最 简单 的 证 明 方法 是 利用 累积 分 布 
函数 法 (在 10.5 节 给 出 了 详细 论述 ). 令 Y = X?, 而 X 的 概率 密度 函数 为 
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累积 分 布 图 数 为 
Ex(Z) = Prob(X < 
如 果 知 道 Y 的 累积 分 布 函数 , 那么 可 以 通过 求 导 来 得 出 了 的 概率 密度 函数 . 
当 y >0 时 , 我 们 有 


Fy(y) = Prob(Y < vy) 
= Prob(X* < yy) 
= Prob(—~Vy < X < VY). 


这 里 一 定 要 小 心 : 条 件 X2 < y 并 不 是 六 < Vi 而 是 -Vy < X < Vy, 这 是 因为 负 
数 的 平方 是 正 数 . 接 下 来 , 我 们 有 


v7 , 
Pa 人 i et /qt = Fx(VD — Fx(-V9). 


最 后 使 用 链 式 法 则 就 完成 了 计算 : 如 果 4A(y) = B(C(y)), 那么 4'(y) = B'(C(y))C0'(y). 


1 212 
V2n 4 
1 
三 (1/2-1) uy/2 
217737(0172) Y C8 


这 里 使 用 了 工 (1/2) = Vx( 在 第 15 章 中 , 我 们 对 它 进行 了 多 次 证 明 ). 结论 得 证 . 
注意 , 也 可 以 采用 略 有 不 同 的 方法 来 计算 , 但 最 终 的 结果 当然 是 一 样 的 . 我 们 
可 以 利用 对 称 性 来 简化 积分 , 于 是 


7 ; 
Fy(y) =2 [ 和 a 


还 有 件 事 值得 一 提 . 当 利 用 累积 分 布 函 数 法 来 求 概率 密度 函数 时 , 要 注意 不 需 
要 知道 Fx 的 具体 公式 . 我 们 只 需要 知道 fx. 这 是 非常 重要 的 , 因为 许多 分 布 ( 比 
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如 标准 正 态 分 布 ) 的 概率 密度 函数 都 有 很 好 的 表达 式 , 但 由 于 积分 很 难 计算 , 我 们 
得 不 到 它们 的 累积 分 布 函数 公式 . 这 真 的 很 神奇 . 求 积 分 可 以 得 到 累积 分 布 函数 ， 
但 随后 立即 微分 就 重新 得 到 了 概率 密度 函数 . 

现在 , 我 们 来 解释 自由 度 为 1 的 卡 方 分 布 一 一 它 是 标准 正 态 分 布 的 平方 . 其 他 
卡 方 分 布 也 有 类 似 的 解释 吗 ? 是 的 ! 想 要 找到 的 话 , 请 继续 读 下 去 . 


16.2 X ~ X2(1) 的 均值 与 方差 
现在 计算 卡 方 分 布 的 期 望 值 (或 均值 ). 首先 考虑 最 简单 的 情形 , 假设 自 
上 = 1. 现在 必须 计算 
四 oo 四 oo z Ee 
[X] = Zjf(z)dz = [ 用 本 FO7 #1le-?/2dz. 
把 常数 提 到 积分 号 外 面 , 并 把 x 的 方 究 合并 起 来 , 则 有 


， 1 1/2 .2/2 
IX| = a 化 六 dz. 


瀑 
Du 


这 种 形式 非常 类 似 于 伽 马 函数 . 但 是 
过 变量 替换 来 轻松 地 修正 . 考虑 前 面 曾 使 | 
且 dz = 2dt 上 述 积分 就 变 成 了 


, 这 里 是 e-*/2, 而 不 是 e-*. 这 个 问题 可 以 通 
过 的 变量 替换 : t = z/2. 此 时 , xz = 2t 


2t1/2e-t2dt. 


|X] = 


1 

201/2) i 
然后 约 分 , 可 得 
" 2 人 /2 一 t 
[X] = a t1/2e—t2dt. 
这 看 起 来 应 该 很 熟悉 . 如 果 把 t1? 改写 成 碚 -1, 那么 上 述 形 式 恰好 是 伽 马 函数 在 
3/2 处 取 值 的 定义 .( 我 们 有 理由 相信 这 里 有 一 个 卡 方 分 布 , 所 以 把 t 的 指数 写成 某 
个 数 减 1 是 很 自然 的 . ) 于 是 , 积分 就 简化 成 了 

2T(3/2) 

T(1/2) 
由 伽 马 函数 的 函数 方程 可 知 , T(s 十 1) = sT(s). 令 s = 1/2 并 把 该 结果 代入 上 式 ， 
则 有 


把 常数 所 到 积分 号 外 面 


[X] = 27(3/2) _ 2(3)7(1/2) 
TU TT(1/2) 
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于 是 , 我 们 证 明了 自 
下 面 来 计算 


由 度 为 上 = 1 的 卡 方 分 布 的 期 望 值 是 1. 
度 为 k= 1 的 卡 方 分 布 的 方差 . 


办 为 


IX2] 一 


oIX], 


所 以 只 需要 求 出 


| 


简化 被 积 函数 并 把 常数 提 到 积分 号 外 国 


[X23]: 


1 


[IX?] = 


2Z2 下 


1 一 Z/2 
2G73TR0T7IJ7 e dz. 


可 得 


20/3T(1/2) 


人 Z3/2e-z/2dz， 
0 


这 里 使 用 的 变量 替换 与 求 期 望 时 是 一 样 的 : 夺 = z/2. 此 时 ,z = 2t 


和 


二 


该 替换 , 上 述 积分 就 变 成 了 
1 


[IX2] = 


20/27(172) Jo 


dz = 2dt. 


2t3/2e-t2dt. 


现在 , 如 果 把 /2 改写 成 好 -1 并 把 常数 提 到 积分 号 外 面 , 那么 这 个 积分 就 等 于 


T(5/2). 通过 进一步 简化 , 我 们 得 到 了 


I 


为 了 求 出 Var(X), 接 下 来 只 需要 让 上 述 结果 减 去 均值 的 平方 , 而 我 们 已 经 求 出 


了 均值 就 是 1. 因此 , 方差 等 于 3 一 12, 即 2. 


我 们 只 计算 了 自 


(5/2 
I 
次 使 用 伽 马 函 数 的 函数 方程 , 这 一 次 令 s = 3/2, 则 有 
PE[X2] = 22T(5/2) 22(3)T(3/2) 23T(1/2) 
TT/2) FTFdG2) LT(1/2) 本 


度 为 1 的 卡 方 分 布 的 均值 与 方差 , 对 于 更 高 阶 的 矩 以 及 其 
他 的 v, 计算 方法 与 之 类 似 . 在 继续 阅读 之 前 , 建议 你 先 尝试 做 一 些 这 样 的 计算 . 


16.3 ” 卡 方 分 布 与 服从 正 态 分 布 的 随机 变量 之 和 


本 节 将 给 出 自由 
态 分 布 的 随机 变量 


和 有 关 . 这 不 难 理 


度 为 k(k 是 正 整数 ) 的 卡 方 分 布 的 解释 . 答案 
解 1 


独立 且 服 从 正 


| 


二 
十 


， 因 为 我 们 已 经 在 16. 


中 看 到 了 正 态 


二 


龟 
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分 布 与 卡 方 分 布 之 间 的 关联 . 这 种 关联 就 是 卡 方 分 布 如 此 重要 的 原因 . 下 节 将 详细 
解释 为 什么 这 让 卡 方 分 布 变 得 重要 , 现在 重点 考察 它们 之 间 的 关系 是 什么 . 


卡 方 分 布 与 服从 正 态 分 布 的 随机 变量 之 和 : 设 是 一 个 下 整数 , Xi1,.… ,Xi 是 
相互 独立 且 均 服从 标准 正 态 分 布 的 随机 变量 , 这 意味 着 X; ~ N(0,1). 如 果 和 .= 
?十 … 十 2, 那么 丈 ~ (Rk). 更 一 般 地 , 设 区 ,了 ,是 m 个 相互 独立 且 
均 服 从 卡 方 分 布 的 随机 变量 , 其 中 到 ~ (wi). 那么 Y= 二 ,十 … 十 ,服从 
自由 度 为 wi 十 … 十 wm 的 卡 方 分 布 . 

和 往常 一 样 , 有 几 种 不 同 的 证 明 方法 . 我 们 会 给 出 其 中 一 些 方法 , 因为 每 种 证 
明 都 阐述 了 概率 论 中 不 同 的 重要 概念 . 特别 是 , 如 果 只 证 明 下 面 的 特例 , 我 们 可 以 
跳 过 接 下 来 的 许多 小 节 . 


1 果 六 ,~ (1) 和 寺 ,~ x?(w) 是 两 个 相互 独立 且 均 服从 卡 方 分 布 的 随机 变 
量 , 那么 区 十 区。 ~ (+ v2). 


并 
ot 


为 什么 这 个 特例 可 以 证 明 所 有 情形 下 的 结果 ? 这 同样 是 因为 我 们 能 适当 地 分 
组 . 我 们 已 经 多 次 见 到 过 这 种 方法 了 (更 多 例子 请 参阅 A.3 节 ). 如果 能 熟练 掌握 
这 一 点 , 就 可 以 免 去 大 量 的 工作 , 你 一 定 想 把 这 种 技巧 收入 圳 中 . 这 是 因为 , 我 们 把 
复杂 的 情况 分 解 成 了 许多 简单 的 情形 , 而 且 做 大 量 简单 计算 并 把 它们 组 合 起 来 通常 
要 比 处 理 一 个 复杂 的 例子 容易 很 多 . 实际 上 , 我 们 正在 做 的 是 归纳 证 明 . 

下 面 通过 两 个 例子 来 说 明 这 一 点 . 设 Xi, X2, Xs 是 相互 独立 的 随机 变量 , 它 介 
均 服 从 N(0,1). 假设 两 个 相互 独立 且 均 服从 卡 方 分 布 的 随机 变量 之 和 仍然 服从 卡 
方 分 布 , 其 自由 度 等 于 两 个 自由 度 之 和 . 那么 , X?, XX3, X3 相互 独立 且 均 服从 x2(1). 
我 们 有 


ol 


X22 X24 X22 = (Xt + XZ2) + X. 


根据 我 们 的 陈述 , 前 两 个 随机 变量 的 和 服从 自由 度 为 2 的 卡 方 分 布 , 把 它 记 作 六 . 
于 是 有 


X1 十 X2 十 X3 = Yo 二 XX2， 


旧 是 , 得 到 的 仍 是 两 个 相互 独立 且 服 从 卡 方 分 布 的 随机 变量 之 和 . 现在 可 以 再 次 使 
用 之 前 的 陈述 , 并 看 到 区 十 X3 服从 x2(3). 我 们 已 经 证 明了 , 三 个 标准 正 态 分 布 的 
平方 和 是 自由 度 为 3 的 卡 方 分 布 . 对 于 一 般 情况 下 的 标准 正 态 分 布 的 平方 和 , 结果 
也 是 类 似 的 . 

服从 卡 方 分 布 的 随机 变量 之 和 的 一 般 情形 是 什么 样 的 ? 论述 过 程 与 之 前 相似 ， 
这 里 只 简单 地 说 一 下 . 使 用 明显 的 符号 (所 有 随机 变量 都 是 相互 独立 的 , 3 始终 服 
从 自由 度 为 v 的 卡 方 分 布 ): 


一 
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Um 


VY, + Ya + Ys 1 | Jr = (Y, | Y,,) 7 en 
ee yp 5 ee Ys 
一 (了 ao Y,,) EE 了 寺中 
Yo tv tvs 十 Ys 水 了 mn: 
如 果 按 照 这 种 方式 继续 论述 下 去 , 最 终 会 得 到 到 ,+ + 
因此 , 一 切 都 归结 为 Xz(m) 十字 (mw) = X2(m 二 z2). 我 们 不 会 直接 证 明 这 个 结 


论 , 而 是 先 考 察 几 个 特例 . 记 住 , 我 们 学 习 本 书 不 是 为 了 解答 一 些 固 
为 了 学 会 使 用 技巧 来 解决 从 未 见 过 的 各 种 问题 . 因 


证 明 , 但 如 果 


想 要 最 简 


巧 , 伦 点 时 间 


必要 的 . 


职 公 


定 的 问题 , 而 是 
此 , 我 们 会 经 常 给 出 一 些 额外 的 
明 地 了 解 概率 , 那 就 跳 过 这 些 证 明 . 不 过 , 要 想 丰 富 你 的 技 
来 阅读 这 些 内 容 是 很 有 

在 接 下 来 的 几 小 节 中 , 我 们 会 采用 不 同 的 方法 来 说 
接 求 积分 法 、16.3.2 节 中 的 变量 替换 定理 , 以 及 最 后 的 卷 


F 明 , 分 别 是 16.3.1 节 中 的 直 
式 . 如 果 你 只 关心 结 


论 的 证 明 , 那么 可 以 跳 到 与 卷 积 有 关 的 两 个 小 节 (16.3.3 节 和 16.3.4 节 ), 但 是 在 其 


他 方法 中 有 许多 重要 的 结果 和 观点 . 花 些 时 间 来 消化 这 些 知 识 是 值得 的 . 特别 是 ， 
化 常数 理论 , 并 考察 了 如 何在 不 求 积分 的 情况 下 得 


在 16.3.2 节 中 , 我 们 建立 了 标准 


到 积分 值 ! 


16.3.1 ”直接 积分 求 平方 和 


我 人 
服从 标准 


布 函数 然后 对 


独立 的 . 我 们 有 


门 已 经 证 明了 如 果 X ~ N(0,1), 那么 X? ~ x?(1). 对 于 
正 态 分 布 的 随机 变量 , 它们 的 平方 和 是 什么 情况 ? 我 们 要 下 
求 导 . 设 Y= X2 二 X2, 其 中 X; ~ N(0,1), 并 目 


Fy(y) = Prob(Y < vy) 
= Prob(X? + X2 <Y) 


现在 , 你 应 i 
个 问题 在 强烈 提醒 


1 
二 三 二 = 
A V 27 


-21/2 A /dnd 
nT 


= 1 (e942)/2g7 dw. 
ZI +73<y 2 


我 们 


9 无 关 , 只 依赖 于 半径 . 
现在 做 极 坐标 变换 , 令 zi = rcosb, za = rsin 0. 由 变量 蔡 换 公式 可 知 dzidza = 


去 想到 接 下 来 要 做 什么 了 . 我 们 在 一 
做 极 坐标 变换 . 另外 , 看 一 下 被 积 函数 . 被 积 


了 王 
x 


个 半径 为 y 的 


吾 
由 


人 于 


JU 


大 个 相互 独立 是 均 
了 次 计算 累积 
| XI 和 XX。 是 相互 


上 积分 , 这 


函数 与 角度 
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rdrdb( 关 于 极 坐 标的 特殊 情形 , 请 参阅 网 络 资料 )， 积 分 上 下 限 是 什么 呢 ? 现在 有 
0:0 一 2m, 但 :0 一 VY 这 是 因为 圆 的 半径 是 Vy, 而 不 是 y. 于 是 


2 
y(y) m=-/ / —e-" /2rdrd0 
0=0 Jr 


既然 已 经 知道 了 累积 分 布 函数 户 -(y), 那么 概率 密度 函数 就 是 它 的 导数 . 因此 是 终 
得 到 了 . 
fy(y) = De 


通过 验证 , 它 就 是 自由 度 为 2 的 卡 方 分 布 的 概率 密度 函数 . 
16.3.2 ”利用 变量 蔡 换 定理 求 平方 和 


考虑 到 求 两 个 标准 正 态 分 布 的 平方 和 的 计算 量 , 我 们 有 理由 对 ”个 平方 和 的 
计算 感到 担忧 . 看 来 有 必要 知道 从 ” 维 箭 卡 儿 坐标 到 n 维 球面 坐标 的 变量 替换 公 
式 ! 本 布 会 涉及 更 高 等 的 知识 , 我 们 假设 读者 熟知 多 元 变量 替换 定理 (参阅 网 络 资 
料 )， 你 可 以 放心 地 跳 过 这 部 分 内 容 并 继续 考察 使 用 卷 积 的 证 明 方法 , 但 我 建议 你 

至 少 浏览 一 下 这 些 论 述 . 这 是 因为 , 我 们 在 卷 积 法 中 使 用 的 标准 化 常数 法 也 会 在 
这 里 出 现 . 你 碰 到 高 级 概念 的 次 数 越 多 , 理解 起 它 来 就 越 容易 . 另 一 个 原因 是 , 变量 
蔡 换 法 会 带 来 很 多 好 结果 . 例如 , 在 分 析 过 程 中 , 我 们 会 得 到 n 维 球体 的 面积 ! 最 
后 , 本 节 是 对 上 节 直 接 积分 法 的 自然 推广 , 因此 从 逻辑 上 讲 , 看 看 我 们 能 在 多 大 程 
度 上 推动 这 些 计算 是 有 意义 的 . 不 过 , 你 可 以 直接 跳 到 卷 各 法 , 再 回 过 头 来 看 本 节 
正如 我 的 一 位 导师 塞 尔 日 ” 兰 曾 在 一 本 书 中 提 到 的 : 如 果 书 必须 按照 页 码 次 序 来 
阅读 , 那 将 是 件 令 人 感到 遗憾 的 事 , 因为 不 同 的 人 会 喜欢 不 同 的 阅读 顺序 ! 

令 人 惊讶 的 是 , 虽然 广义 球面 坐标 有 很 好 的 公式 , 但 我 们 不 需要 知道 , 因为 可 
以 利用 称 为 标准 化 常数 理论 的 方法 . 我 们 知道 , xz1,… ,zk 可 以 用 半径 > 和 一 1 个 
角度 91,… ,04_1 来 表示 . 它们 有 如 下 形式 的 关系 


Xl1 二 rhi(01, Wa , Ok-1) 


Tk =Thx(01,..* ,Op-1). 
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要 确保 我 们 的 理解 相同 : 不 同 的 hh; 各 有 公式 . 我 们 可 以 治 着 这 种 思路 走 下 去 , 利用 
这 些 具体 公式 来 计算 . 然而 , 引入 这 部 分 内 容 是 为 了 告诉 你 如 何 从 正确 的 角度 考察 
问题 , 从 而 避免 这 些 可 怕 的 计算 . 我 们 仍 要 使 用 变量 替换 定理 . 即便 不 知道 变量 替 
换 所 涉及 的 函数 , 也 可 以 做 变量 替换 , 这 看 起 来 让 人 感到 惊讶 , 但 正 是 该 方法 的 魅 
力 所 在 ! 

现在 回顾 一 下 变量 蔡 换 定理 . 


变量 替换 定理 : 设 V 和 W 是 R* 中 的 有 界 开 集 . 设 映 射 h:V 一 W 既是 一 对 
一 的 , 又 是 映 上 的 , 其 定义 如 下 


h(wi,* , Uk) 一 (hi(ui1,* , Uk) ,hp(U1, ) Uk)). 


设 f:W 一 恨 是 一 个 连续 有 界 的 函数 . 那么 


[ER pn es 


= fr he, Ja) Tu ,Wy du dup, 
其 中 J 是 雅 可 比 行列 式 , 即 


Oh1 Ohi 
| 
Ohx Ohx 


如 果 想 使 用 这 个 定理 , 就 要 知道 变量 蔡 换 函数 h;. 有 种 巧妙 的 方法 可 以 让 我 们 
摆脱 痛苦 的 计算 . 我 们 要 弄 清 楚 体 积 元 dz1… dzx 是 如 何 变化 的 , 显然 有 
dz1 。。 .QZ 一 9(7, 01, 0. ,Op_1)drd01 Je .qd0 1. 
这 里 没有 涉及 数学 运算 , 只 是 用 字母 9 来 表示 答案 . 现在 引入 数学 运算 . 我 们 一 定 
有 


9(m0 701) = TIC(0 01). 
为 什么 ? 这 是 由 单位 分 析 得 出 的 . 在 二 维 空间 中 , dzidzs 一 rdrd9; 在 三 维 空间 中 ， 
dzidzadza 一 72 sin91drd91d9. 注意 , 半径 的 方 容 比 变量 个 数 少 1. 这 是 因为 角 变 
量 是 无 单位 的 ， 如果 drd01:…d9n_1 的 单位 是 “ 米 ”, 那么 dx1:… dz 的 单位 就 是 
“ 米 », 所 以 , 这 里 需要 一 个 因子 r*-!. 因此 , 我 们 证 明了 存在 某 个 复杂 的 函数 C 使 


4 日 
笨 


dZ1 .dz 一 re 1C(01 ;05_1)drd01 .qd0 1， 
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现在 回 到 我 们 的 问题 . 设 Y = XI 十 … 十 X&. 再 次 使 用 累积 分 布 函数 的 技巧 可 


Fy(y) = Prob( XI 二. 十 X < 
1 


1 
es e—21/2... a ce 一 zk/2dzj .dzx 
2z2 十 …+z2<y V2T 27 


1 2 2 
一 (Z1 十 … 十 2 2 
,0 jz (Z1 大 )/ dzZ1 .dz 
ZX1 十 … 十 Zk 全 区 


接 下 来 做 变量 替换 . 我 们 不 关心 角度 的 积分 区 域 , 所 以 该 区 域 用 从 4; 到 wi 来 表示 
(wz 和 4; 分 别 是 积分 上 下 限 ): 


VY ful Up—1 一 r2/2 k-1C(0 .0 
上 |/ RE vi a 
7 一 0 01=l1 三 三 (27) 


事实 上 ， 人 但 这 里 很 容易 出 错 . 假设 角度 的 积分 区 域 是 一 个 
(k 一 1) 维 的 盒子 . 那么 1 和 w_1 应 该 是 角度 9 到 9_2 的 函数 , 而 如 -和 
Uk—2 应该 是 角度 度 9 到 ps 的 函数 , 依 此 类 推 . 幸运 的 是 , 发 生变 化 的 只 是 积分 限 ， 
而 接 下 来 要 做 的 与 之 前 相同 . 

我 们 对 有 一 1 个 角 变 量 求 积 分 , 而 这 个 积分 值 与 7 和 y 无 关 , 所 以 把 它 记 作 
Cx( 它 确实 与 角 变 量 的 个 数 有 关 ). 因此 


VY 


Fy(y) = c.f er /2rk-1ldr. 
7 一 0 


令 Ar) = Cre-"/2rk-1, 有 H(7) 是 ar) 的 原 函 数 . 那么 


然后 求 导 , 我 们 (几乎 ) 得 到 了 概率 密度 函数 : 


i) = HYD = Pe 
为 什么 说 “几乎” 呢 ? 问题 在 于 , 这 里 仍然 有 常数 Oi 我 们 应 该 求 出 角 变 量 的 
积分 从 而 确定 Ck 的 值 ,但 事实 并 非 如 此 . 因此 , 我 们 没有 得 到 最 终 的 答案 . 幸运 的 
站 ,计算 Cs 是 非常 简单 的 ,这 看 起 来 很 落户 一 能 如 何 计算 Cu? 不 应 该 早点 算 册 
来 吗 ? 此 外 , 如 果 要 计算 它 , 我 们 不 是 要 找 出 从 笛 卡 儿 举 标 到 球面 坐标 的 变量 葵 换 
公式 应 该 是 什么 吗 ? 
能 轻松 求 出 Ch 的 原因 是 Y = X? 二.… + X? 是 一 个 随机 变量 , 它 的 概率 密度 
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函数 一 定 为 1! 根据 前 面 的 内 容 , 我 们 已 经 知道 自由 度 为 天 的 卡 方 分 布 的 概率 密度 
函数 公式 . 用 y 表示 虚拟 变量 , 则 有 ( 当 y > 0 时 ) 
1 

2 邢 (873J 7 
注意 , 在 这 个 式 子 中 , y 的 表达 式 与 户 (W) 中 的 完全 一 样 , 因此 , 两 者 的 标准 化 常数 
也 肯定 一 样 ! 
是 个 非常 重要 的 问题 , 毫 无 疑问 是 本 书 中 最 重要 的 问题 之 一 . 虽然 有 其 他 方 
出 答案 , 但 我 更 喜欢 这 种 方法 , 因为 它 阐述 了 标准 化 常数 
理论 的 力量 . 令 人 难以 置信 的 是 , 它 竞 然 让 我 们 绕 过 了 那些 痛苦 的 计算 . 这 种 情况 
在 高 等 数学 中 经 常 出 现 , 尤其 是 在 随机 算 阵 理论 中 ， 
注 16.3.1 即使 不 知道 自由 度 为 上 的 卡 方 分 布 的 概率 密度 吨 3 然 可 以 根 

据 fy(y) 的 积分 值 为 1 来 求 出 Oj 的 值 . 这 里 会 用 到 伽 马 通 数 , 其 定 


TI(s) Es e ®zs ldz. 
0 


$ -le-y/2. 


回 到 我 们 的 问题 , 现在 有 
和 fr Way = Ff ovayitdy, 
做 变量 替换 , 令 了 = V/2, 所 以 dy = 2dz， 
1= Ce /oz3 和 -1z 人 -12dz = CE .2 氏 (8) 

2 上 2 


这 意味 着 
Cp 1 
2 28/2T(k/2) 
注 16.3.2 每 当 看 到 一 种 新 方法 时 , 都 有 必要 探索 可 以 把 它 推广 到 什么 程度 . 
我 们 还 能 从 上 述 分 析 中 得 到 哪些 信息 呢 ? 在 我 们 的 计算 中 隐 含 着 n 维 球体 的 “ 表 
面积 ”! 记 住 , 体积 元 变 成 了 


rr1IC(0 ;01)drdbl .dOx_1, 


而 且 我 们 指出 了 


1 
Rs 一 一 CC(0 ,00 1)d0d0 1 = Ci. 
人 人 (27)*/2 ( 1 k 1) J k—1 k 
利用 上 面 求 出 的 O74 值 , 得 到 


41 2(27)*/2 2 .nt/2 
ee CO ,Op_1)d01:..d0.1 = = | 
a 人 ( " , . a 2*/2T(k/2) LT(k/2) 
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我 们 说 , 这 就 是 n 维 球体 的 表面 积 . 为 什么 呢 ? 之 前 , 我 们 对 一 个 只 依赖 于 半径 的 
函数 求 积 分 ,因此 这 里 的 变量 替换 可 以 看 作 将 一 个 半径 为 V5 的 n 维 球体 划分 成 
一 系列 半径 从 0 到 了 的 球形 党 . 对 于 具体 的 n, 该 公式 可 以 给 出 什么 信息 ? 


7 一 2:2 
n= 3:47n 
n = 4:2m 


除了 最 后 一 行 , 前 两 种 情况 分 别 是 众所周知 的 单位 圆 的 周 长 和 单位 球 的 表面 积 . 

一 个 很 好 的 练习 是 进一步 推广 这 种 方法 , 计算 出 mn 维 球体 的 体积 . 在 n 维 空间 
中 , 考察 单位 球 与 边 长 为 2 的 立方 体 的 体积 比 是 件 很 有 趣 的 事 , 因为 这 告诉 我 们 把 
n 维 球体 放 入 n 维 立方 体 中 所 占 的 百分比 是 多 少 . 
16.3.3 ” 卷 积 法 求 平方 和 

本 节 将 给 出 另 一 种 方法 来 证 明 , 服从 标准 正 态 分 布 的 随机 变量 的 平方 和 服从 卡 
方 分 布 . 本 节 的 中 心思 想 与 变量 替换 法 一 致 . 具体 地 说 , 我 们 的 目的 是 向 你 展示 , 如 
何 利用 标准 化 常数 理论 来 避免 大 量 烦琐 的 计算 . 

本 节 使 用 卷 积 理论 来 分 析 相 互 独立 的 随机 变量 之 和 . 回顾 一 下 , 如 果 X 的 概 
率 密度 函数 是 户 , Xo 的 概率 密度 函数 是 户 , 并 且 Xi 和 X。 是 相互 独立 的 , 那么 
Xi 十 XX 的 概率 密度 函数 就 是 


fxi+xa(7) 2 I f(t)fo(z 二 t)dt. 


我 们 在 第 10 章 和 第 19 章 中 详细 地 讨论 了 卷 积 , 这 里 简单 地 说 明 它 为 什么 成 立 . 假 
设 我 们 希望 Xi 十 Xs 等 于 zx. 该 怎么 做 到 这 一 点 昵 ? 如 果 Xi = t, 那么 Xs。 显然 必 
须 等 于 z 一 t. 六 = 的 概率 是 方 折 , 而 X2 = zz 一 t 的 概率 是 户 (z 一 如 . 把 它们 相 
乘 就 得 到 了 两 个 结果 同时 发 生 的 概率 . 然后 对 t 的 所 有 值 积分 , 这 样 就 考虑 到 了 所 
有 可 能 的 情况 . 我 们 把 广 和 名 的 卷 积 记 作 方 * fo, 于 是 


eC 人 A f(s bdt. 


回忆 一 下 , 如 果 一 个 随机 变量 的 概率 密度 函数 是 
1 a 


fa(z) = 人 16—2/2 人 
其 他 ， 


那么 这 个 随机 变量 就 服从 自由 度 为 a 的 卡 方 分 布 , 其 中 工 是 伽 马 函数 (阶乘 函数 的 
推广 ), 其 定义 为 
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s—1 一 2 
L(8) := | re “dzx. 
我 们 知道 , 如 果 X; 服从 标准 正 态 分 布 , 那么 X? 服从 自由 度 为 1 的 卡 方 分 布 . 对 于 
自由 度 为 d 的 卡 方 分 布 , 其 标准 化 常数 记 作 cu. 
基本 情形 : 我 们 先 考 虑 两 个 卡 方 分 布 的 和 , 并 且 每 个 分 布 的 自由 度 均 为 1. 和 


(fi * f1)(7) = j. f(t fi(z —t)dt 


一 小 cit™ 1/2e7t/2 .ci(z —t)- /2e (70/2dt. 
0 


这 里 的 积分 上 限 为 x 因为 当 xz 一 t 为 负 时 , 户 (z 一 六 = 0. 对 上 式 进行 化 简 可 得 
(is 有 加 = eh fs dt 
0 


接 下 来 有 两 种 方法 . 第 一 种 方法 是 直接 求 出 这 个 积分 . 通过 亦 力 计算 也 许 能 够 做 到 
这 一 点 , 但 这 种 做 法 并 不 受 欢迎 . 注意 , 最 后 的 答案 一 定 是 个 概率 分 布 . 因此 , 我 们 
` 需 要 精确 地 计算 出 这 个 积分 , 只 要 知道 它 依赖 于 z 就 足够 了 ! 如 果 知道 这 个 积 
分 依赖 于 zx, 那么 通过 写 出 ( 户 * 方 )(z) 关于 2 的 积分 并 让 结果 等 于 1, 就 可 以 求 出 
标准 化 常数 . 这 是 一 种 非常 巧妙 且 强 大 的 想法 , 如 果 能 学 会 正确 地 做 到 这 一 点 , 你 
就 可 以 避免 许多 令 人 痛苦 的 积分 . 
我 们 看 一 看 t 积分 . 出 现 x 的 唯一 位 置 是 (z 一 -12. 如 果 令 t= wz, 就 得 到 
了 了 (Zz 一 wr)-12=z-12(1 一 w)-1/2, 这 样 就 可 以 把 > 完全 提取 出 来 ! 于 是 , 可 以 做 下 
列 巧妙 的 变量 替换 : 令 t= wz 且 dt = zdu. 因为 志 的 取 值 范围 是 从 0 到 zx, 所 以 
的 取 值 范围 是 从 0 到 1. 于 是 有 


1 
(A*f)(r)= ce 2 人 (zu) -12(z — zu) 2rdu 


I 
_ 2,.—x/2 小 =1/271 NET 
一 cie a wu/“(1—w) du. 


4 积分 可 以 写成 一 个 很 好 的 形式 , 因为 它 与 参数 为 a = 6 = 1/2 的 贝塔 分 布 的 概率 
密度 函数 积分 成 正比 (参见 15.5 节 ). 我 们 也 可 以 做 一 些 巧 钞 的 变量 蔡 换 , 但 是 没 
有 必要 ! 用 Ci 表示 wv 积分 的 值 , 有 


Clc2e-z/2 右 2 0 
(ny* 户 )G) = | 其 他 . 


因为 这 是 个 概率 分 布 , 所 以 它 的 积分 值 一 定 为 1, 这 表明 了 Cic? = 1/2( 因 为 / 
e-*/2dzx = 2). 再 次 强调 , 虽然 可 以 通过 蛮 力 计算 出 C1, 但 没有 这 个 必要 . 为 了 证 明 
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我 们 得 到 了 一 个 自由 度 为 2 的 卡 方 分 布 , 现在 只 需要 证 明 上 式 依赖 于 x 即 可 , 因为 
标准 化 常数 肯定 与 分 布 相 匹配 . 

归纳 步 又 : 现在 考察 一 般 情形 . 我 们 采用 归纳 法 证 明 . 现在 已 经 解决 了 基本 情 
形 , 接 下 来 必须 证 明 Xf 了 十 … 十 X241 服从 自由 度 为 n 十 1 的 卡 方 分 布 . 由 归纳 法 可 
知 , X? 了 十.… 十 X2 服从 自由 度 为 n 的 卡 方 分 布 . 仍 把 标准 化 常数 记 作 cv 和 ct, 我 
们 看 到 


a IC js OC 
| cnt3—le-t/2.c (zt ie (20/2d. 
0 


把 指数 因子 结合 在 一 起 得 到 了 e-*/2. 再 次 令 t= ux 且 dt = zdu, 那么 


1 
(fi*.e# fi)(2) = cncre "2 (zu) -1(z — wu) rdu 
0 


1 
有 -1 -和 至 一 和 
= cncie /2r3 -lz ef us 1(1 — wu)- 3du 
0 


1 
ar 生 着 一 一 于 
= cnclz 叶 -1e | uz (1 — wu) 2du. 
0 


同样 , 我 们 可 以 得 到 一 个 闭合 型 的 v 积分 (从 本 质 上 看 , 它 就 是 参数 为 n/2 和 1/2 
的 贝塔 分 布 的 概率 密度 函数 的 积分 ), 但 重要 的 是 , 这 个 积分 与 无 关 . 把 该 积分 记 
作 C 于 是 


+ —16—2/2 在 zy>0 


n+t1 
Cncnc1T 2 


0 其 他 . 


注意 , 对 z 的 依赖 性 恰好 就 是 对 自由 度 为 n 十 1 的 卡 方 分 布 的 依赖 性 . 因此 , 标准 
化 常数 Cacncl 一 定 等 于 自由 度 为 nn 十 1 的 卡 方 分 布 的 标准 化 常数 . 再 次 强调 , 我 们 
可 以 通过 蛮 力 来 计算 这 个 常数 , 但 仍然 没有 必要 ! 
16.3.4 ”服从 卡 方 分 布 的 随机 变量 之 和 

我 们 集中 证 明了 服从 标准 正 态 分 布 的 随机 变量 的 平方 和 将 服从 卡 方 分 布 . 这 
些 证 明 都 不 错 , 并 且 曾 述 了 很 多 很 棒 的 技巧 , 然而 ,从 极 简 主 义 的 观点 来 看 , 它们 
都 是 不 必要 的 . 我 们 只 需要 证 明 , 如 果 六 ~ (m1) 和 天 ~ X() 是 两 个 相互 独 
立 且 均 服 从 卡 方 分 布 的 随机 变量 , 那么 于 十 让 和 ~ YX 2(wi 十 v2)， 如果 vw 和 vs。 都 
是 整数 , 那么 六 十 六 就 可 以 简化 成 服从 标准 正 态 分 布 的 随机 变量 的 带 括号 的 平方 
和 , 即 


Girt = 


(XI+ 二 XX? ) 二 (X21 十 … 十 X24 )， 


接着 再 使 用 广义 的 球面 坐标 . 
如 果 和 芒 不 是 整数 呢 ? 事实 证 明 , 我 们 可 以 利用 16.3.3 节 的 卷 积 法 . 因为 
卷 积 法 的 证 明 中 从 来 没有 假设 过 和 z 是 整数 , 所 以 这 种 论述 方法 更 具有 普遍 
性 . 这 是 个 很 重要 的 问题 , 我 们 将 给 出 一 般 证 明 . 
设 并, 和 二 ,的 概率 密度 函数 分 别 是 所 ， 和 所 ,, 那么 Y = 二 ,+ 六 的 概率 密 
度 函 数 是 


mg = (ff)(W) = pi 


= | Cu tle-t/2 ‘Cua(Y 一 t) 3 -le (yt)/2dt. 
0 


把 指数 因子 结合 起 来 就 得 到 了 e-Y/2. 我 们 仍然 令 t= uy 且 dt = ydu, 那么 


v. 


小 
Pa [ a 
0 


1 
te hs on, eat py Es i jy 
= cy cme YIy3 ly y (1—u3 du 
0 


l 
Z1 十 zx2 1 _ pt RE a 
一 cncly 2 -le | uz -11 — uz: ldu. 
0 


同样 , 我 们 可 以 得 到 一 个 闭合 型 的 v 积分 , 因为 它 本 质 上 就 是 参数 为 n/2 和 1/2 的 
贝塔 分 布 的 概率 密度 函数 的 积分 (参见 15.5 节 ). 不 过 重要 的 是 , 这 个 积分 与 y 无 
关 . 把 该 积分 记 作 Cy,, 于 是 
Cy enery le-y/2 若 y>0 
| 0 其 他 . 
注意 , 对 y 的 依赖 性 恰好 就 是 对 自由 度 为 vi + vo 的 卡 方 分 布 的 依赖 性 . 因此 , 标准 
化 常数 C, ,cycvs 一 定 等 于 自由 度 为 vi 十 v2 的 卡 方 分 布 的 标准 化 常数 . 
值得 我 们 (一 次 又 一 次 ! ) 强调 的 是 , 标准 化 常数 理论 可 以 帮助 我 们 避免 一 
些 非常 难 算 的 积分 ， 自 由 度 为 v 的 卡 方 分 布 的 标准 化 常数 很 容易 找到 ,， 它 只 是 
个 与 伽 马 函数 有 关 的 简单 表达 式 . 虽然 计算 伽 马 函数 的 值 并 不 容易 , 但 从 理论 
上 看 , 这 一 点 并 不 重要 一 一 现在 已 经 命名 了 标准 化 常数 .我 们 不 需要 算出 w 积 
的 值 ! 
值得 注意 的 是 , 可 以 用 这 些 论述 来 推导 贝塔 函数 的 基本 关系 式 ! 对 读者 来 说 ， 
这 是 个 不 错 的 练习 (参见 习题 16.5.22). 


16.4 总 结 


Ry 
Cl 


我 们 引入 了 男 一 个 重要 的 概率 分 布 族 , 即 卡 方 分 布 . 它 有 一 个 自 | 
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相关 的 计算 都 与 伽 马 函数 有 关 . 我 们 还 发 现 , 相互 独立 且 服 从 卡 方 分 布 的 随机 变量 
之 和 也 服从 卡 方 分 布 . 因此 , 卡 方 分 布 是 一 个 稳定 的 分 布 , 这 意味 着 独立 的 随机 变 
量 之 和 的 形状 与 每 个 随机 变量 的 形状 相同 . 这 是 个 很 不 寻常 的 性 质 , 并 且 通 常 难 以 
成 立 . 例如 , 服从 均匀 分 布 的 随机 变量 之 和 不 服从 均匀 分 布 , 服从 指数 分 布 的 随机 
变量 之 和 也 不 服从 指数 分 布 . 另外 , 还 有 其 他 的 稳定 分 布 (连续 型 分 布 包括 正 态 分 
布 和 柯 西 分 布 , 离散 型 分 布 包括 泊 松 分 布 ). 它们 在 分 析 中 非常 有 用 , 因为 函数 的 形 
式 没有 改变 . 

我 们 讨论 了 几 种 处 理 积分 的 方法 , 从 蛮 力 计算 到 变量 替换 , 再 到 察觉 函数 的 依 
赖 性 并 使 用 标准 化 常数 理论 . 我 个 人 最 喜欢 最 后 一 种 方法 . 从 本 质 上 说 , 这 能 在 不 
计算 积分 的 情况 下 得 到 积分 值 ! 

本 章 最 后 简要 地 介绍 卡 方 分 布 在 统计 学 中 的 应 用 . 它们 之 所 以 发 挥 着 如 此 重 
要 的 作用 , 是 因为 服从 标准 正 态 分 布 的 随机 变量 的 平方 服从 自由 度 为 1 的 卡 方 分 
布 , 而 且 人 们 通常 会 假定 误差 服从 正 态 分 布 . 然而 , 误差 的 和 并 不 是 非常 有 用 , 因为 
正 误差 可 以 与 负 误差 抵消 . 我 们 可 以 对 误差 的 绝对 值 求 和 , 但 绝对 值 疯 数 是 不 可 币 
的 , 所 以 微 积 分 工具 也 不 再 适用 . 接 下 来 最 简单 的 组 合 是 误差 的 平方 和 , 现在 我 们 
可 以 看 到 为 什么 卡 方 分 布 出 现 了 . 有 关 这 方面 的 更 多 内 容 , 请 参阅 第 24 章 关 于 最 
小 二 乘法 的 内 容 . 

有 三 种 不 同类 型 的 卡 方 检验 在 应 用 中 非常 重要 . 首先 请 参阅 22.5 节 对 卡 方 拟 
合 优 度 检验 的 解释 , 它 用 来 衡量 一 组 分 类 数据 是 否 来 自 某 个 特定 的 离散 分 布 . 其 次 
是 卡 方 齐 性 检验 , 它 应 用 于 来 自 多 个 不 同 总 体 的 单个 分 类 变量 , 并 检验 该 变量 的 频 
率 计 数 在 不 同 总 体 中 是 否 有 统计 学 差异 . 换 句 话说 , 卡 方 齐 性 检验 用 来 测试 不 同 总 
体 的 频率 计数 是 否 服从 同一 种 分 布 . 最 后 一 种 是 卡 方 独立 性 检验 , 它 应 用 于 来 自 同 
一 总 体 的 多 个 分 类 变量 , 并 确定 变量 之 间 的 关联 是 否 具 有 统计 学 意义 . 换言之 , 卡 
方 独立 性 检验 考察 的 是 变量 之 间 是 否 存 在 独立 性 . 

拟 合 优 度 检验 、 齐 性 检验 以 及 独立 性 检验 均 采 用 相同 的 方法 来 计算 检验 统计 
量 . 通常 , 数据 被 组 织 成 一 个 列 联 表 , 并 由 分 类 变量 划分 . 卡 方 检验 统计 量 是 这 样 算 

来 的 : 对 于 列 联 表 的 每 个 单元 , 把 观察 到 的 与 预期 的 频率 计数 做 差 之 后 平方 , 然 
后 除 以 预期 的 频率 计数 , 最 后 求 和 : 
> (观察 值 ; 一 预期 值 ;)? 
预期 值 ; 
卡 方 齐 性 检验 和 卡 方 独 立 性 检验 在 遗传 学 领域 都 非常 有 用 , 后 者 在 确定 同一 染 
色 体 上 基因 之 间 的 遗传 连锁 程度 方面 特别 有 用 . 关于 卡 方 拟 合 优 度 检验 的 应 用 , 请 
参阅 习题 16.5.16. 关于 卡 方 独立 性 检验 的 应 用 , 请 参阅 习题 16.5.17. 
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16.5 习 题 449 


16.5 “ 习 题 

习题 16.5.1 “对 于 自由 度 为 天 的 卡 方 分 布 , 求 出 其 均值 与 方差 . 

习题 16.5.2 ”对 于 自由 度 为 天 的 卡 方 分 布 , 求 出 其 偏 斜 度 . 

习题 16.5.3 ”如 果 一 个 随机 变量 服从 自由 度 为 天 = 2 的 卡 方 分 布 , 那么 该 变量 的 PDF 是 什 
么 ? 这 与 我 们 见 过 的 其 他 分 布 有 什么 关联 ? 

习题 16.5.4 如果 一 个 随机 变量 服从 自由 度 为 天 = 2 的 卡 方 分 布 , 那么 该 变量 的 CDF 是 什 
么 ? 

习题 16.5.5 ”对 于 任意 的 有 ， 卡 方 分 布 是 对 称 的 吗 ? 如 果 是 ， 关 于 哪个 点 对 称 ?k 取 何 值 时 对 
称 ? 

习题 16.5.6 ”证 明 : 当 上 大 趋 近 于 无 穷 大 时 , 卡 方 分 布 趋向 于 关于 对 称 . 

习题 16.5.7 ” 设 随 机 变量 X 服从 参数 为 的 卡 方 分 布 , 并 且 Y = VX, 求 出 Y 的 概率 密度 

习题 16.5.8 ”你 正在 测量 两 点 之 间 的 距离 . 如 果 两 个 方向 上 的 误差 相互 独立 且 均 服从 参数 为 
/和 的 正 态 分 布 , 求 出 总 误差 的 概率 分 布 . 

习题 16.5.9 “对 直线 进行 数据 拟 合 最 常用 的 方法 是 最 小 化 每 个 点 与 拟 合 线 之 间 的 距离 平方 . 
请 解释 一 下 , 为 什么 要 考察 差 的 平方 , 而 不 是 只 使 用 原始 误差 或 取 误 差 的 绝对 值 . 这 种 做 
法 可 能 有 哪些 不 足 ? 更 多 相关 信息 , 请 参阅 第 24 章 . 

习题 16.5.10 ”解释 卡 方 分 布 和 伽 马 分 布 是 如 何 关 联 起 来 的 . 

习题 16.5.11 “对 于 那些 了 解 统计 学 知识 的 读者 , 请 解释 如 何 利用 卡 方 分 布 来 检验 线性 回归 
中 误差 的 正 态 性 . 

习题 16.5.12 ”对 于 那些 了 解 统计 学 知识 的 读者 , 请 写 一 段 话 , 从 概率 的 角度 证 明 卡 方 齐 性 检 
验 法 的 合理 性 (也 就 是 说 , 为 什么 检验 统计 量 是 一 个 服从 卡 方 分 布 的 随机 变量 , 为 什么 自 

度 等 于 分 类 变量 的 水 平 数 减 1 再 乘 以 总 体 的 个 数 ). 

习题 16.5.13 ”想象 一 下 , 我 们 正 把 一 只 飞镖 扔 向 飞镖 台 . 在 任意 方向 上 , 飞镖 落 点 与 中 心 点 
的 距离 均 服 从 标准 正 态 分 布 . 求 出 飞镖 落 点 与 中 心 点 的 距离 的 概率 密度 函数 . 如 果 误 差 
不 服从 标准 正 态 分 布 , 而 是 服从 均值 为 0 且 方 差 为 2 的 正 态 分 布 , 那么 结果 又 如 何 ? 

习题 16.5.14 ”想象 一 下 , 我 们 有 两 个 飞镖 靶 , 其 中 一 个 是 上 一 题 中 的 二 维 飞 镖 台 , 另 一 个 是 
条 直线 . 同样 地 , 每 个 方向 上 的 误差 均 服 从 标准 正 态 分 布 . 那么 , 飞镖 与 二 维 靶 心 的 距离 
比 一 维 靶 心 更 近 的 概率 是 多 少 ? 

习题 16.5.15 ”更 一 般 地 , 对 于 n 维 飞镖 惑 , 求 出 飞镖 落 点 与 靶 心 距离 的 概率 密度 函数 . 每 个 
方向 上 的 误差 均 服 从 正 态 分 布 . 随 着 n 的 增加 , 总 距离 的 均值 是 如 何 变化 的 ? 

习题 16.5.16 ”对 于 了 解 统计 学 知识 的 读者 而 言 , 卡 方 分 布 经 常 在 遗传 学 中 使 用 . 假设 我 们 
做 了 个 杂交 试验 , 对 纯 红 色 的 花 和 纯 白色 的 花 进行 杂交 . 如 果 得 到 了 25 条 白色 的 花 、35 
灯 粉 色 ( 介 于 红色 和 白色 之 间 ) 的 花 和 20 条 红色 的 花 , 那么 你 是 否 拒绝 这 样 的 假说 : 花 
条 表现 出 的 单 基因 不 完全 显 性 导 禾 了 1 :2 :1 的 表 型 比例 ? 

习题 16.5.17 ”考虑 以 下 给 定 表格 中 的 数据 , 是 否 有 足够 的 证 据 表 明 : 一 个 人 坐 在 概率 班 的 
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哪 一 排 与 他 在 课堂 上 的 整体 表现 有 关 ? 假设 概率 班 是 从 较 大 的 学 生 群 体 中 抽取 出 来 的 , 是 


个 有 代表 性 的 样本 . 
成 绩 | 第 1 排 | 第 2 排 | 第 3 排 | 第 4 排 
8 6 长 6 
B 13 13 13 14 
C 6 9 5 8 
D 8 让 10 7 


I 


习题 16.5.18 ”假设 你 购买 的 股票 第 一 年 返回 的 利润 可 以 用 随机 变量 X ~ N(.1, .1) 来 模拟 ， 
而 且 第 二 年 返回 的 利润 率 与 第 一 年 相同 . 股票 价格 在 前 两 年 内 增加 至 少 30% 的 概率 是 多 
少 ? 

习题 16.5.19 ” 求 出 自由 度 分 别 为 2、4、6 和 8 的 卡 方 分 布 的 中 位 数 . 将 这 些 点 画 出 来 , 并 画 
出 一 条 穿 过 这 些 点 的 回归 线 , 从 而 得 到 卡 方 分 布 中 位 数 的 近似 公式 . 并 使 其 成 为 自由 度 
的 函数 . 

习题 16.5.20 ”从 自由 度 为 1 的 卡 方 分 布 中 随机 选取 1000 个 数 . 绘制 每 个 数 中 首位 数字 的 
频率 . 用 自由 度 为 10 的 卡 方 分 布 来 重复 此 操作 . 比较 柱状 图 . 

习题 16.5.21 ”假设 我 们 想 在 a = 0.1 的 显著 性 水 平 下 , 利用 卡 方 齐 性 检验 来 确定 骨 子 是 否 
均匀 . 我 们 将 其 抛掷 60 次 , 得 到 了 以 下 结果 : 


加 


山 子 的 点 数 | 1| 2| 3| 41 5| 6 
观察 值 7|1119|11013111310 
预期 值 10 | 10 10 113101310 1310 


计算 以 下 检验 统计 量 : 于 ”更 轴 合计 从 划 值 02 一 (十 合生 2 二 5 
G0 + Go + Go5o2 二 1.2. 如 果 已 知 骨 子 是 均匀 的 , 那么 这 个 检验 统计 量 是 不 
是 不 合理 ? 将 其 与 下 面 的 p 表格 进行 比较 , 这 个 p 表格 描述 的 是 服从 自由 度 为 5 的 卡 方 
分 布 的 随机 变量 , 表 中 的 概率 是 指 得 到 的 值 大 于 或 等 于 下 一 行 中 检验 统计 量 的 概率 . 
概率 0.90 | 0.50 | 0.10 | 0.05 | 0.01 
检验 统计 量 | 1.61 | 4.35 | 9.24 | 11.07 | 15.09 

p 表格 告诉 我 们 , 在 a = 0.1 的 显著 性 水 平 下 , 1.2 的 检验 统计 量 低 于 临界 值 1.61. 
此 , 没有 是 够 的 统计 证 据 表明 山子 是 不 均匀 的 . 换 句 话说 , 我 们 不 能 拒绝 般 子 是 均匀 的 
原 假 设 . 

如 果 得 到 了 下 列 结果 , 情况 又 如 何 ? 


六 


骨 子 的 点 数 | 1| 2 3| 41 5| 6 
观察 值 6|13| 9113|1 5|112 
预期 值 10 | 10 110 1 13101310 1310 


习题 16.5.22 ”利用 16.3.4 节 中 的 论述 来 推导 贝塔 函数 的 基本 关系 式 ， 
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在 完美 的 世界 里 , 我 们 可 以 轻松 准确 地 回 
计算 出 现 的 概率 往往 是 非常 困难 的 . 这 是 ! 
处 理 , 而 其 他 时 候 则 是 
问题 , 我 们 不 需要 知道 确切 的 答案 , 只 要 得 到 
虑 电梯 的 重量 限制 . 如 


于 各 种 原因 
因为 我 们 想 知道 在 极限 中 发 生 了 什么 .幸运 的 是 , 对 于 许 
定 范 
果 其 最 大 容量 是 500 千克 , 那么 真实 值 可 能 接近 500 千克 ， 


内 


答 任何 问题 . 然而 , 在 现实 中 , 要 精确 
造成 的 . 有 时 初始 分 布 很 难 


多 


的 答案 就 足够 了 . 例如 , 考 


并 不 是 说 499 干 克 就 能 安全 地 运行 , 而 501 千克 会 导致 电梯 坠毁 . 这 个 数 的 意义 是 


给 我 们 考虑 的 量 一 个 合理 的 大 致 范围 . 
本 章 的 目的 是 介绍 几 种 概率 不 等 式 . 不 难 理 
能 说 的 也 就 越 多 . 我 们 将 证 明 单个 随机 变量 的 相 


解 , 我 们 对 基本 分 布 了 解 得 越 多 ， 
关 结 果 , 以 及 标准 化 和 的 极限 值 


LT 


相关 结果 . 和 的 问题 处 理 起 来 有 些 琼 手 , 因为 考察 极限 过 程 的 方法 有 很 多 种 .这 就 
要 求 引入 各 种 收敛 的 概念 , 本 章 要 比 书 中 其 他 地 方 做 更 多 分 析 . 


Lav 


17.1 不 等 


二 


口 


马尔 可 夫 不 等 式 上 只 需要 很 少 的 条 件 . 对 随机 变量 X 的 假设 只 要 满足 均值 有 限 


且 是 非 负 的 就 够 了 . 如 果 平 均值 是 无 定义 的 , 那么 不 能 


期 望 对 概率 说 出 任何 有 意义 


的 东西 , 所 以 下 面 的 假设 会 非常 弱 . 弱 假 设 的 优点 是 适用 于 很 多 不 同 的 情况 , 而 缺 


二 个 假设 , 即 随机 变量 是 


点 是 由 于 在 很 多 情况 下 都 适用 , 所 以 它 的 结果 3 
非 负 的 假设 , 最 初 ; 


白 


到 一 个 能 使 


现成 人 


也 


/DA 


例如 , 当 已 知 4 = 


|X] 时 , 关于 Prob(XX 


之 Q 


) 


会 | 


日 


不 强 . 得 
不 是 很 清晰 , 所 以 我 们 花 了 些 时 间 来 解释 这 一 假设 的 合理 性 . 
我 们 可 以 证 明 无 数 多 个 不 等 式 , 但 是 其 中 大 部 分 都 没什么 用 . 我 们 的 目 
推导 出 不 平凡 结论 的 不 等 式 . 为 了 达到 这 个 目的 , 我 们 来 
探讨 一 下 , 在 只 有 均值 信息 的 前 提 下 , 取 较 大 值 的 概率 会 有 哪些 限制 . 
EB 得 到 些 什 么 ? 因为 我 们 想 知 
道 有 哪些 可 能 的 结果 , 所 以 为 了 简化 代数 运算 , 不 妨 设 == 0. 为 了 更 加 具体 , 取 
a = 2. 于 是 , 我 们 将 探讨 关于 Prop(X > 2) 的 边界 问题 . 
率 , 所 以 它 肯 定 至 少 为 0 且 至 多 为 1, 但 问题 是 我 们 能 否 得 到 更 多 信息 . 


AI 


然 , 我 们 知 


标 是 找 


道 这 是 个 概 


现在 要 做 的 是 为 X 选择 不 同 的 分 布 , 并 看 看 这 些 分 布 是 如 何 影 响 Prob(X > 2) 


的 . 第 一 个 选择 是 令 X~ Unif(-1,1). 此 时 的 均值 为 0( 根 据 需 要 ), 并 且 
2) = 0. 事实 上 , 对 于 任意 的 c 乏 2, 由 X~Unif(-coe) 均 可 
当 c 大 于 2 时 会 发 生 什 么 ? 此 时 , Prob(X > 2) 会 变 成 正 的 , 而且 


Prob(X > 


出 Prob(X > 2) = 0. 


|[ 当 cc 一 co 
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人 1/2. 如 果 和 ~ Unif(-c,c) 且 c> 2, 那么 真正 的 概率 是 
rob(X > 2) = 扫 ? = 一:. 虽然 这 意味 着 prob(X > 2) 会 严格 小 于 1/2, 但 我 们 
] 以 把 这 个 概 来 变 大 例如 , 如 果 


= 若 |z| € [2,3] 
i 
J | 其 他 . 


加 学 


妃 


那么 Prob(X >2) = 1/2. 

我 们 能 找到 一 个 概率 大 于 1/2 且 均 值 为 0 的 随机 变量 吗 ? 有 趣 的 是 , 可 以 找到 
这 样 的 随机 变量 , 而 且 我 们 可 以 让 这 个 概率 尽 可 能 地 接近 1. 考虑 一 个 离散 型 随机 
变量 (一 个 很 好 的 练习 是 , 对 此 做 出 调整 并 找到 一 个 连续 型 的 随机 变量 ), 存在 某 个 
正 数 "使 得 


Prob(X=2)=p, Prob(X= -0b)=1— 
在 这 里 写 -b 而 不 是 5 的 原因 是 , 我 想 让 未 知 数 尽量 取 正 数 ， 这 样 只 要 看 下 符号 
就 能 得 到 信息 . 因为 希望 均值 为 0, 所 以 


2p 一 b(1-p) = 0， 或 者 b = 这 


因此 , 只 要 p < 1 就 可 以 找到 一 个 随机 变量 X 使 得 Prop(X > 2) = 

这 意味 着 什么 呢 ? 这 意味 着 , 当 我 们 遍历 所 有 均值 为 0 的 随机 变量 X 时 , Prob 
(和 >2) 的 取 值 会 从 0 变 到 尽 可 能 接近 于 1. 因此 , 如 果 只 有 均值 的 信息 , 那么 不 可 
能 得 到 Prop(X > 2) 的 一 个 不 平凡 边界 . 如 果 想 在 估算 ; 这 个 概率 上 取得 进展 ， 必须 
对 X 做 额外 的 假设 . 
上 面 的 例子 说 明了 一 个 自然 的 限制 . 为 了 让 Prob(X > 2) 接近 1, X 取 较 大 负数 
的 概率 应 该 较 小 . 如 果 XX 不 能 取 太 大 的 负 值 , 那么 这 些 例子 将 不 可 用 , 而 Prob(X > 
2) 或 许 会 有 一 个 不 平凡 的 边界 . 事实 的 确 如 此 . 当然 , 在 我 们 展开 分 析 之 前 , 有 可 
能 存在 其 他 随机 变量 会 满足 这 个 附加 的 约 来 条件 并 县 Le Prob(X > 2) 趋 于 1. 

下 一 节 将 陈述 马尔 可 夫 不 等 式 , 希望 这 里 的 讨论 能 充分 说 明 它 为 什么 有 这 样 的 
假设 . 除了 知道 X 的 均值 外 , 我 们 还 假设 X > 0. 换 句 话说 , X 取 负 值 的 概率 是 0. 
这 样 就 排除 了 使 得 Prob(X > 2) 尽 可 能 接近 于 1 的 概率 密度 函数 族 . 
如 果 你 上 只 关心 马尔 可 夫 不 等 式 的 陈述 , 那么 本 节 是 没什么 用 的 , 可 以 跳 过 , 直 
接 查 看 相关 结果 . 然而 , 这 里 的 思维 过 程 对 于 解决 各 种 问题 都 很 有 用 . 我 们 的 想法 
是 找 出 合理 的 约束 是 什么 , 让 你 了 解 应 该 证 明 什 么 , 并 于 清楚 什么 是 有 可 能 实现 的 . 
我 们 已 经 看 到 , 在 只 有 均值 的 情况 下 想 要 得 到 一 个 好 的 边界 是 不 合理 的 一 一 我 们 需 
要 更 多 信息 . 这 里 有 几 种 方法 可 以 选择 . 马尔 可 夫 不 等 式 采 取 的 方法 是 把 随机 变量 
限制 为 非 负 数 . 虽然 这 避免 了 Prob(X > 2) 趋 近 于 1, 但 我 们 还 有 其 他 选择 . 也 可 
以 为 X 的 方差 假设 一 个 边界 , 这 样 就 限制 了 分 布 的 伸展 范围 , 并 且 会 让 概率 有 一 
个 不 平凡 的 边界 . 我 们 在 切 比 雪夫 不 等 式 中 采用 了 这 种 方法 . 


454 
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17.2 


从 上 面 的 讨论 中 可 以 看 到 , 只 


马尔 可 夫 不 等 式 
知道 


平凡 边界 . 因 
随机 变量 上 . 


此 , 我 们 要 给 出 更 多 假设 . 


X 的 均值 , 不 可 能 得 到 Prob(X > a) 的 不 
第 一 个 结果 来 自 于 把 考察 对 象限 制 在 非 负 


马尔 可 夫 不 等 式 : 设 X 是 


有 些 作者 会 把 


个 均值 有 限 的 非 负 
着 Prob(X < 0) = 0). 那么 , 对 于 任意 的 正 数 a, 有 


Prob(X > a) 
5[X] 写成 jx. 男 一 


Prob(X <a) > 1—— 


随机 变量 , 均值 为 


[X]( 这 意味 


< 


个 等 价 公式 


。 


在 讨论 证 明之 前 ， 有 必要 看 一 


下 这 个 说 法 是 否 合理 


现在 为 X 指定 一 个 单 


位 , 不 妨 设 它 是 用 来 测量 高 度 的 . 无 论 X 的 单位 是 什么 , a 也 有 同样 的 单位 , 所 以 


o[X]/a 是 个 无 单位 的 量 . 这 很 好 


我 们 还 能 做 哪些 验证 ? a 有 几 个 特别 好 的 选择 . 如 果 a < 
夫 不 等 式 可 知 , X 至 少 为 a 的 概率 会 小 于 等 于 某 个 比 1 大 的 数 . 因 


因为 它 本 该 是 个 概率 . 


LX], 


| 


tb. 


1, 所 以 这 没有 提供 任何 信 ， 
中 得 到 任何 有 上 


但 


是 , 如 果 和 仔细 想 一 想 , 我 们 不 应 该 期 
的 信息 . X 等 于 a 的 概率 可 能 为 1, 在 这 种 性 


况 下 ， 


还 可 以 考虑 另 一 种 极端 情况 , 令 p 
0 的 概率 是 p, 以 及 XX 等 于 


中 我 们 


值 为 
近 11! 

不 等 式 仅 在 a 大 于 E[X] 
相似 ， 如 果 唯 一 的 非 零 概率 


时 才 有 用 . 这 是 有 道 到 
出 现在 X 大 于 


任意 一 个 小 于 均值 的 a, 这 个 概 


|X] 时 , 那么 X 的 均 


[X], 但 这 是 不 可 能 发 生 的 . 因 
马尔 可 夫 不 等 式 的 实质 就 是 量 
在 阅读 证 明 的 过 程 

用 到 了 它 , 因 


此 , 对 于 所 有 


中 , 试 着 看 一 看 在 
为 它 是 定理 的 一 个 条 件 ! 通 
么 能 够 简化 证 明 . 删 掉 一 个 条 件 并 查看 能 否 找到 反例 


的 w > 


是 任意 一 个 小 于 1 的 数 . 这 样 就 得 到 了 , X 等 于 
[IX]/(1 一 p) 的 概率 是 1 一 p. 此 昌 
[X] 的 非 负 随机 变量 , 但 对 了 


CIX], 均 有 Prob( 
化 这 个 概率 (作为 a 的 函数 ) 比 1 小 的 程度 . 


那么 由 马尔 可 
为 概率 最 多 是 
待 从 这 种 情形 


这 个 概率 为 0. 


得 到 了 一 个 均 
率 会 尽 可 能 接 


的 , 它 与 介 值 定理 ( 见 B.1 节 ) 


值 一 定 会 大 于 


X > a) < 1. 


下 


那里 使 用 了 非 负 性 . 我 们 应 


该 在 某 个 地 方 


会 是 个 


马尔 可 夫 不 等 式 的 证 明 : 


证 日 


常情 况 下 , 这 些 条 件 要 么 是 必 不 可 少 的 , 要 
不 错 的 主意 . 


用 到 了 两 个 不 错 的 技巧 . 第 一 个 是 如 果 x > w， 
那么 z/a > 1. 我 们 首先 展开 Prob(X > a) 的 定义 , 然后 在 此 基础 上 改写 1. 为 方便 


17.2 马尔 可 夫 不 等 式 ”455 
起 见 , 假设 随机 变量 是 概率 密度 函数 为 fx 的 连续 型 随机 变量 , 这 样 就 可 以 通过 求 
只 分 来 计算 概率 . X 是 离散 型 随机 变量 时 的 证 明 思 路 与 之 类 似 . 我 们 有 
Prob(X > a) = 人 二 fx (x)dz 

= /_ 1 x(Wae 

< | _ Extodr 

本 zxGDdz 
最 后 一 个 积分 与 X 均值 的 定义 非常 相似 ， 它 与 之 不 同 的 唯一 原因 在 于 , E[X] 是 


zjx(z) 在 -co 到 co 上 的 积分 , 但 这 里 的 积分 


是 一 个 非 负 随 机 变量 , 所 以 X 小 于 0 的 概率 是 0. 于 是 


1 
Prob(X a) <-— 
a 


人 rfx(r)dz 
* 人 0 


结论 得 证 . 


全] 


外 人 


换 句 话说, 没 必要 在 小 于 0 的 区 域 上 求 积 分 . 为 什么 这 一 点 很 重要 ? 我 们 要 而 


的 . 我 们 利用 了 


\ 等 式 的 处 理 是 正 胡 


区 


人 rfx(r)dr < [, 2jx(z)dqz; 


这 个 结果 之 所 以 成 立 , 是 因为 被 积 函 数 zfx(z) 在 i 
分 下 限 小 于 0, 被 积 函 数 为 负 , 那么 积分 值 就 可 能 是 
变 小 , 而 我 们 对 不 等 式 的 处 理 是 错误 的 . 


例如 , 假设 X 等 于 1L 的 概率 是 1/2, X 等 于 -1 的 概率 也 是 1/2. 那么 ， 


旦 


那么 , 我 们 在 哪里 使 用 了 非 负 性 ? 利用 非 钠 性 , 我 们 得 


到 了 


玄 区 域内 是 非 负 的 . 但 是 , 如 果 积 
负 的 . 在 这 种 各 


区 域 是 从 a 到 oo. 我 们 可 以 轻松 地 
解决 这 个 问题 . 由 于 被 积 函数 是 正 的 , 可 以 把 积分 下 限 延伸 到 0. 这 种 做 法 
增加 积分 值 , 要 么 使 积分 值 保持 不 变 . 我 们 没 必要 把 积分 下 限 扩展 到 -co, 因为 X 


保 对 


4 况 下 , 积分 值 会 


[IX] = 0. 


如 果 马 尔 可 夫 不 等 式 的 结论 成 立 , 那么 对 于 任意 正 数 a, 都 有 Prob(X > a) < 0. 这 


显然 是 亮 雇 的 (只 需要 让 a = 1/2 或 1). 


既然 已 经 看 到 了 证 明 , 我 们 来 考察 一 个 例子 . 不 妨 设 美国 的 人 均 收 入 是 60 000 


美元 . 随机 选 出 一 个 家 庭 的 收入 至 少 为 120 000 美元 的 概率 是 多 少 ? 至 少 为 1 000 000 
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美元 的 概率 是 多 少 ? 

如 前 所 述 , 我 们 没有 足够 的 信息 来 解决 这 个 问题 . 也 许 有 些 人 非常 富有 , 而 其 
他 人 却 赚 不 到 钱 ; 或 者 恰恰 相反 , 也 许 每 个 人 的 收入 都 接近 平均 水 平 . 如 果 不 知 道 
收入 是 如 何 分 配 的 , 我 们 就 无 法 得 到 确切 的 答案 . 但 是 , 可 以 利用 马尔 可 夫 不 等 式 
来 得 到 答案 的 范围 . 为 此 , 我 们 需要 一 个 均值 有 限 且 非 负 的 随机 变量 . 如 果 假 设 没 
有 家 庭 的 收入 是 负 的 , 那么 上 述 条 件 就 能 满足 , 因为 另 一 个 条 件 已 经 实现 了 (均值 
是 有 限 的 60 000 美元 ). 
因此 , 一 个 家 庭 至 少 有 120 000 美元 收入 的 概率 不 会 超过 60 000/120 000 = 172， 
或 者 说 , 收入 是 平均 水 平 2 倍 的 人 最 多 占 总 人 口 的 一 半 . 那么 百 万 富 例 呢 ? 成 为 百 
万 富翁 的 概率 最 多 是 60 000/1 000 000 = 0.06, 这 种 家 庭 最 多 占 6%. 

可 以 把 这 个 例子 进一步 推广 , 并 得 到 下 列 边界 . 


设 X 是 一 个 非 负 的 随机 变量 , 且 均 值 E[X] 是 有 限 的 . X 的 取 值 不 小 于 1 乘 以 
均值 的 概率 最 多 等 于 1/: 


Prob(X > [E[X]) < 


遗憾 的 是 , 这 是 我 们 利用 有 限 信息 能 得 到 的 最 好 结果 . 只 要 随机 变量 的 均值 有 
限 并 且 该 随机 变量 是 非 负 的 , 那么 它 等 于 均值 的 100 倍 或 更 多 倍 的 概率 不 会 大 卫 
1/100, 即 1%.， 当然 , 在 很 多 问题 中 , 真实 概率 要 比 这 个 小 得 多 . 有 时 , 这 会 是 一 种 
过 高 的 估计 . 这 显然 暗示 了 下 面 要 做 什么 : 纳入 更 多 信息 , 获得 更 好 的 边界 ! 在 下 
一 节 中 , 我 们 将 做 到 这 一 点 . 
问题 : 考虑 一 些 均值 有 限 的 非 抽 随机 变量 . 哪些 随机 变量 可 以 在 尽 可 能 多 的 a 处 
把 马尔 可 夫 不 等 式 “ 近 似 于 ”等 式 ? 这 是 个 非常 开放 的 问题 . 你 需要 清楚 要 如 何 衡 
量 近似 度 , 以 及 你 关心 的 是 哪些 a. 探索 一 些 模 糊 问 题 是 很 好 的 . 尝试 几 个 不 同 的 
分 布 , 看 一 下 如 果 想 以 较 高 的 概率 使 取 值 远大 于 平均 水 平 , 都 需要 做 些 什 么 . 


l 


17.3 切 比 雪夫 不 等 式 


17.3.1 陈述 


马尔 可 夫 不 等 式 使 用 了 一 个 输入 来 限制 概率 , 即 随机 变量 的 均值 . 我 们 已 经 看 
到 , 这 是 不 够 的 . 为 了 得 到 一 个 不 平凡 的 结果 , 我 们 还 需要 更 多 假设 . 一 种 方法 是 
假设 随机 变量 是 非 负 的 . 在 考察 马尔 可 夫 不 等 式 时 , 我 们 使 用 了 这 种 方法 . 本 节 将 
采取 另 一 种 方法 , 它 会 给 出 一 个 更 好 的 不 等 式 . 能 得 到 更 好 结果 的 原因 是 , 我 们 将 
融入 更 多 有 关 随 机 变量 的 信息 , 而 不 仅仅 是 非 负 性 . 
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下 个 合乎 逻辑 的 选择 是 限定 标准 差 的 取 值 范 围 (或 方差 的 取 值 范围 , 因为 知道 
其 中 一 个 就 能 轻松 地 找到 另 一 个 ). 标准 差 告 诉 我 们 变量 在 均值 附近 的 波动 幅度 . 我 
们 有 充分 的 理由 相信 , 利用 这 种 方法 会 得 到 更 好 且 更 严格 的 边界 . 这 将 给 出 切 比 雪 
夫 不 等 式 . 这 是 我 最 喜欢 的 结果 之 一 , 原因 有 很 多 . 第 一 个 原因 是 它 的 条 件 非常 弱 ， 
这 意味 着 你 儿 乎 可 以 用 它 来 处 理 遇 到 的 任何 分 布 . 当然 , 这 是 有 代价 的 一 一 因为 条 
件 很 弱 , 所 以 它 的 结果 没有 其 他 结果 那样 强 . 第 二 个 是 个 人 原因 : 我 的 拼写 能 力 很 
炉料 , 而 切 比 雪夫 (Chebyshev) 保持 厦 接 受 度 最 遇 的 纪录 . 沃 尔 弗 拉 姆 的 《数学 世 
界 》 中 列 出 了 40 种 译 法 , 比较 受 欢迎 的 包括 Chebyshov、Chebishev、Chebysheff、 
Tschebischeff、 Tschebyshev、Tschebyscheff 和 Tschebyschef. 


定理 17.3.1( 切 比 雪 夫 不 等 式 ) 设 X 是 一 个 随机 变量 , 它 的 均值 WUx 和 方差 o2 
都 是 有 限 的 . 那么 , 对 于 任意 的 > 0, 有 


1 

k2° 

有 些 作者 会 把 jx 写成 E[X]. 这 意味 着 ,随机 变量 与 均值 的 距离 至 少 为 太 个 标 
准 差 的 概率 不 超过 1/k?. 另 一 个 有 用 的 等 价 公式 为 

1 


Prob(|X—Lx|2 kox) < 


Prob(|X 一 Axl < Kox) > 1— 


在 证 明 切 比 雪夫 不 等 式 之 前 , 先 讨论 一 下 它 的 陈述 并 考察 其 含义 . 和 往常 一 样 ， 
首先 要 做 的 是 指定 单位 并 做 出 检验 ， 如 果 X 用 来 测量 高 度 ( 设 单位 是 米 ), 那么 
| 一 jx| 之 kox 中 包含 了 三 个 高 度数 据 . 现在 考察 的 是 变量 与 均值 之 间 的 距离 . 另 
外 , 我 们 使 用 最 普通 的 尺度 进行 比较 . 因为 标准 差 衡量 的 是 均值 附近 波动 程度 的 大 
小 , 所 以 求 一 个 值 与 均值 相差 了 多 少 个 标准 差 是 合理 的 . 

另 一 种 不 错 的 检验 方法 是 考察 k 的 不 同 选择 . 注意 , 如 果 < 1, 那么 这 个 概率 
至 多 为 1( 即 至 多 为 100%). 换 句 话说, 我 们 没有 得 到 任何 有 用 的 信息 , 因为 每 个 事 
件 发 生 的 概率 都 不 会 超过 1. 我 们 考虑 两 个 不 同 的 随机 变量 . 第 一 个 变量 只 取 0 而 
第 二 个 变量 取 1010 和 一 10100 的 概率 各 占 一 半 . 这 两 个 随机 变量 的 均值 都 是 0. 对 
于 任意 的 有 < 1, 第 一 个 变量 处 于 个 标准 差 之 内 的 概率 是 100%, 但 第 二 个 变量 的 
相应 概率 是 0( 其 方差 为 


民 


1 1 
(10100 0)?.3 F (一 10100 02 .了 一 
所 以 标准 差 是 10100). 这 个 例子 表明 了 , 当 k < 1 时 我 们 得 不 到 任何 有 效 信息 , 因 
为 从 本 质 上 看 , 任何 事情 都 可 能 发 生 . 
当天 > 1 时 , 情况 就 完全 不 同 了 , 因为 我 们 得 到 了 一 些 信息 .大 越 大 , 变量 与 均 


值 乙 间 相 差 有 个 或 更 多 个 标准 


差 


在 马尔 可 夫 不 等 式 


中 , 我 


比 雪夫 不 等 式 可 以 告诉 我 们 什么 


在 切 比 雪 夫 不 等 式 中 , 变量 
因此 , 如 果 标 准 差 是 cx, 均值 
:距离 就 是 (1 一 1)ux. 我 们 有 


级 . 
么 |X—hx| > lx — Hx: 


门 看 到 变量 值 
呢 ? 不 事 的 是 , 它 无 法 


的 概率 就 越 小 . 


为 1 乘 以 均值 的 概率 不 会 超过 1/. 切 


三 


直接 回答 这 个 问题 . 原 


因 是 


与 均值 之 间 的 距离 是 通过 标准 差 来 衡量 的 , 而 不 是 数量 


变量 


a 


EHX 


的 值 至 少 为 1 与 均值 的 乘积 ,局 


JJ 候 ， 


( 


注意 , jx 与 ox 的 单位 相互 抵消 了 , 而 大 是 
切 比 雪 夫 不 等 


进而 有 
k = 


kox 


> Lux 


(1 — Dux 
sp" 


》 


式 中 , 我 们 最 


ox/(px(l— 1)°). 


比 雪 夫 不 等 3 
可 夫 不 等 
1/l; 但 是 , 切 比 雪夫 不 等 对 
似 于 C/(1 一 1)?( 当 1 很 大 时 , C 
不 等 


17.3.2 


种 方法 展示 了 妇 


如 何 
我 们 的 目标 从 来 都 不 是 提 
来 做 好 准备 . 
由 马尔 可 夫 不 等 式 推 出 切 比 雪夫 不 等 式 的 证 明 : 
标准 差 为 cx 的 随机 变量 . 关于 如 何 
可 夫 不 等 式 . 因 
] 正 在 考察 的 切 比 雪夫 不 等 


人 


这 与 马尔 可 夫 不 等 式 相 比如 人 


终 得 至 


1 了 , 变量 值 至 少 


个 无 


单位 的 量 . 把 这 个 结果 代入 到 
为 ! 与 均值 乘积 的 概率 不 会 超过 


可 ? 同样 , 我 们 不 能 直接 比较 这 两 个 结果 ， 


因为 切 


HE 


求 输入 标准 差 . 1 


是 , 我 们 可 以 看 


x 


式 告诉 我 们 , 对 于 


变量 至 少 等 


于 ! 与 均值 乘积 的 概率 ， 


本 廊 ” 


式 相对 于 
证 明 


与 外 日 


现在 给 出 证 明 . 外 


1 /x 


F 何 一 个 重要 结果 都 值得 斥 


1 何 从 马尔 可 夫 不 等 


洒 小 \ 


马尔 可 夫 不 等 式 中 推导 出 切 比 雪 


等 式 中 推导 出 切 比 雪夫 不 等 
直接 . 后 者 与 我 们 证 明 马 尔 可 夫 不 等 式 的 思路 相似 (应 


至 少 两 种 不 同 的 方法 来 证 


究 当 1 变 大 时 会 发 生 什么 . 马尔 


下 降 速 度 至 少 为 


告诉 我 们 , 存在 某 个 常数 C 使 得 这 个 概率 的 衰减 速度 近 
/(1 一 1)? 其 实 就 是 CVD2). 这 让 我 们 了 解 到 切 比 雪夫 


可 夫 不 等 式 的 力量 : 对 于 较 大 的 4, 使 


目 切 比 雪夫 不 等 式 会 更 好 


生生 
朱 


明 . 多 
式 ,， 第 二 种 证 明 则 更 加 
先 介绍 


理解 , 我 们 会 先 介 乡 


出 最 短 的 证 


此 , 现在 需要 找 杀 
式 中 


第 一 个 不 错 的 尝试 是 Y = 


= 


明 这 个 问 


证 


. yfy (vy)dy, 
y=0 


§ 夫 不 等 式 ). 
明 , 而 是 强调 人 


个 均值 有 限 的 非 负 随机 变量 
的 量 有 关 . 
|X 一 /xl|. 这 个 变量 是 非 负 的 , 但 
清楚 它 的 均值 是 多 少 . 我 们 必须 要 计算 


该 不 允 
是 夏 意 写 得 较 见 长 ， 


下 面 的 证 明 是 
应 该 如 何 处 理 这 样 的 问题 , 为 将 


=} 


设 X 是 一 个 均值 为 nx 且 
题 , 有 个 提示 : 我 们 打算 使 用 马尔 
并 且 它 应 该 与 我 


目前 还 不 
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然后 用 fx(z) 来 表示 fy(y). 这 里 涉及 求 绝对 值 的 积分 , 但 这 个 积分 很 难 计 算 . 另 
外 , 我 们 完全 不 清楚 该 如 何 引 入 标准 差 . 这 表明 了 我 们 应 该 做 下 一 个 尝试 , 即 W = 
(XX 一 jx)>. 这 样 做 的 好 处 是 , 平方 要 比 绝对 值 更 容易 处 理 , 在 计算 W 的 均值 时 , 我 
们 会 看 到 X 的 方差 (关于 平方 相 比 绝对 值 的 优势 , 请 参阅 第 24 章 的 最 小 二 乘法 ). 
我 们 有 


= 人 ojrtodao = (ep) fxn)ae 


最 后 一 个 等 式 是 利用 方差 的 定义 得 到 的 


2 
Ox 


现在 已 经 证 明了 W = (X -yx)? 是 非 负 的 , 且 均 值 为 o3. 
是 有 限 的 . 接 下 来 对 W 使 用 马尔 可 夫 不 等 式 . 于 是 有 
[WW] 

ee 


Prob(W 2 a) < 


现在 只 需要 选择 a 的 值 . 通过 蔡 换 可 得 


= OX， 


X 的 假设 可 知 ， 


2 2 
Prob((X -uax2 > 和 宝 ， 或 者 Prob(IX -pxl>va < 之 . 


现在 , 切 比 雪夫 定理 的 内 容 拯救 了 我 们 ， 并 告诉 我 们 a 应 该 是 什么 : 只 需要 让 Va= 
kox( 所 以 a = 12o%). 这 样 就 得 到 了 


结论 得 证 . 


第 一 个 证 明 的 目标 是 强调 思考 过 程 . 如果 我 们 非常 聪明 地 想到 了 使 用 马尔 可 


1 


(oa 
Prob(|X — hx| 之 kox) < Ro 一 12， 


夫 不 等 式 , 那么 该 如 何 组 织 已 有 的 信息 , 从 而 可 以 使 用 这 个 不 等 式 呢 ? 我 们 的 任务 


算 


全 


是 看 


从 某 种 意义 上 说 , 我 们 基本 上 是 在 习 


定 目标 , 并 利用 它 来 指导 我 们 进行 代数 


用 Z/a 之 | 而 是 当 已 知 Iz— hx| 过 kox 时 ， 使 用 (号 人) >1. 
直接 证 明 切 比 雪夫 不 等 式 : 设 fx 是 X 的 概率 密度 函数 . 假设 X 是 一 个 连续 


型 随机 变量 , 离散 的 情形 可 以 类 似 地 证 明 . 我 们 有 


Prob(|X 一 HAx| > kox)= / 1. jx(z)dz 


zi|z 一 MX|>Eox 


1 


第 二 种 证 明 方法 与 马尔 可 夫 不 等 式 的 证 明 有 很 多 相似 之 处 . 这 坚 不 奇 怪 , 因为 
E 新 论证 马尔 可 夫 不 等 式 . 此 处 不 在 zx > a 时 使 


2 
TT— HX 
< ; d 
人 | kox ) 人 


全 
和 T—HXxX fx rz)dz 
hk20% ee ) ( ) 


1 


一 d 
Ro 人 Lx) jx(z)dz 


1 2 

二 二 .0% 二 一 
2 一 7 和 3) 
k2ox k 


注意 , 可 以 把 上 述 积分 区 域 扩展 到 所 有 的 x, 因为 被 积 函 数 (z 一 jo)?fx(z) 始 
终 是 非 负 的 . 这 与 马尔 可 夫 不 等 式 证 明 中 的 被 积 函 数 zx(z) 是 不 同 的 . 我 们 必须 
非常 小 心 , zfx(z) 的 积分 下 限 不 能 延伸 到 比 0 小 的 数 . 


17.3.3” 正 态 分 布 与 均匀 分 布 的 例子 


考虑 一 个 问题 来 进行 比较 . 设 X 服从 标准 正 态 分 布 , 这 意味 着 X 的 均值 为 0， 
标准 差 为 1. 由 切 比 雪夫 不 等 式 可 知 , 随机 变量 与 均值 相差 个 标准 差 的 概率 不 超 
过 1/12. 因此 , X 与 均值 的 距离 大 于 等 于 两 个 标准 差 ( 即 |X| > 2) 的 概率 最 多 是 


1/4, 即 25%; X 与 均值 的 距离 至 少 是 五 个 标准 差 的 概率 最 多 是 1/25, 即 4%; X 与 


均值 的 距离 大 于 等 于 10 个 标准 差 的 概率 最 多 是 1/100, 即 1%. 这 些 只 是 概率 的 上 


界 . 它们 与 真实 值 相差 多 少 ? 上 面 三 种 情况 的 真实 值 大 约 是 4.55%、0.000 057 3% 


和 1.52.10-21%. 


里 然 真实 值 低 于 利用 切 比 雪夫 不 等 式 得 到 的 上 界 , 但 是 低 得 过 头 了 . 发 生 了 什 
么 ? 问题 在 于 我 们 对 切 比 雪夫 定理 的 要 求 太 高 了 . 记 住 , 切 比 雪夫 不 等 式 的 条 件 很 
弱 . 这 一 点 是 好 的 , 因为 它 说 明了 切 比 雪夫 不 等 式 能 够 在 很 多 情况 下 使 用 . 但 问题 


是 它 的 结果 不 可 能 那么 强 , 因为 必须 适用 于 很 多 从 
好 性 质 来 得 到 更 好 的 上 界 . 


4 况 . 我 们 需要 利用 分 布 自身 的 较 


特别 是 , 这 说 明了 我 们 要 继续 寻找 更 好 的 上 界 . 这 自然 会 引导 我 们 研究 随机 变 


量 的 和 与 极限 性 质 . 在 许多 情况 下 , 这 些 性 质 都 是 由 中 心 极限 定理 决定 的 . 在 研究 


这 些 性 质 之 前 , 对 于 那些 衰减 速度 远 低 于 标准 正 态 分 布 的 概率 密度 函数 , 我 们 有 必 
要 回顾 一 下 由 马尔 可 夫 不 等 式 与 切 比 雪夫 不 等 式 给 出 的 上 界 . 


设 X~ Unif(0,1) 服从 [0,1] 上 的 均匀 分 布 ， 


它 的 概率 密度 函数 为 : 当 y > 0 时 , fy(y) = e-Y; 


并 设 Y ~ Exp(1) 服从 指数 分 布 ， 


量 都 是 非 负 的 . 它们 的 均值 分 别 是 


否则 fy(y) = 0. 这 两 个 随机 变 
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按照 类 似 的 计算 方法 (我 们 不 会 这 么 做 ), 方差 分 别 是 


接 下 来 计算 由 马尔 可 夫 不 等 式 和 切 比 雪夫 不 等 式 给 出 的 上 界 , 并 把 它们 与 真实 
值 进行 比较 . 我 们 考察 X > 0.95 和 YY > 4. 警告 : 在 下 文中 , 我 故意 犯 了 最 常见 的 
错误 之 一 你 能 否 在 阅读 时 找到 它 ! 

。 马尔 可 夫 不 等 式 : 利用 Prob(X > a) < E[X]/a. 于 是 , X > 0.95 的 概率 最 多 
是 E[X]/0.95, 或 0.5/0.9 s 0.55. 类 似 地 , Y > 4 的 概率 最 多 是 1/4 = 0.25. 
马尔 可 夫 不 等 式 使 用 起 来 非常 轻松 ! 
切 比 雪夫 不 等 式 : 现在 , 我 们 要 把 想 求 的 概率 写成 Prob(|X 一 E[X]| > kox) 
的 形式 , 而 这 个 概率 最 多 是 1/k?. 因此 , X > 0.95 的 概率 最 多 是 1/ 妇 , 其 中 
0.95 一 EE[X] = kox. 利用 上 面 的 值 , 我 们 看 到 大 = (0.95 一 0.5)/(1/12) = 27/5. 
所 以 上 述 概率 最 多 是 1/(27/5)?, 即 25/729 < 0.034. 我 们 得 到 了 | 和 一 0.5| > 
0.45 的 概率 上 界 , 但 遗憾 的 是 , 切 比 雪夫 不 等 式 包 含 了 两 种 情况 , 即 六 > 0.95 
入 <0.05. 对 于 了 我 们 注意 到 , 如 果 站 至 少 是 4, 那么 Y 与 均值 的 距离 至 
少 是 三 个 标准 差 ( 即 = 3), 因此 YY 至 少 是 4 的 概率 不 会 超过 1/32 < 0.11. 

e。X > 0.95 的 真实 概率 为 0.05, 而 立 >4 的 真实 概率 是 1/e4 0.018. 

那么 , 哪里 出 错 了 呢 ? 我 们 从 马尔 可 夫 不 等 式 中 得 到 的 上 界 都 大 于 真实 值 , 所 以 
这 些 数字 通过 了 第 一 个 检验 . 但 由 切 比 雪夫 不 等 式 得 到 的 结果 却 并 非 如 此 , 在 均匀 
分 布 中 , 上 界 竟然 比 真实 概率 小 ! 啊 ! 我 们 做 错 了 什么 ? 问题 出 现在 值 的 确定 上 . 
让 0.95 一 0.5 = kox 是 正确 的 . 出 现 问题 的 地 方 是 , 它 的 方差 cx 是 1/12. 我 们 不 能 
把 ox 写成 1/12, 正确 的 写法 是 cx = V1/12. 由 此 可 得 = (0.95 - 0.5)/VI/12 = 
1.56. 因此 , 上 界 是 1/ 妇 , 即 100/243 3 0.41. 这 仍然 比 马 尔 可 夫 不 等 式 给 出 的 上 界 
小 , 但 远 远 高 于 真实 值 . 

毫 不 奇怪 , 马尔 可 夫 不 等 式 使 用 起 来 更 容易 , 但 在 这 些 例子 中 , 切 比 雪夫 不 等 
式 的 结果 更 接近 于 真实 值 . 
作为 一 个 很 好 的 挑战 , 试 着 找到 一 个 概率 密度 函数 为 fx 的 随机 变量 X, 使 
得 切 比 雪夫 不 等 式 尽 可 能 地 接近 于 等 式 ， 例 如 , 能 和 否 找到 一 个 随机 变量 X, 使 得 
Prob(|X - px| >KEox)=1/2 对 所 有 整数 上 >1L 均 成 立 ? 


17.3.4 ”指数 分 布 的 例子 


再 考虑 一 个 比较 马尔 可 夫 不 等 式 、 切 比 雪 夫 不 等 式 以 及 真实 值 的 例子 . 令 X~ 
Exp(1), 那么 当 z >0 时 fx(x) =e-”, 否则 fx(zx) =0. XX 的 均值 为 1=1 是 方差 
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为 o? = 1. 我 们 能 轻松 地 得 到 这 些 值 是 因为 , 标准 指数 分 布 的 矩 是 由 伽 马 函数 给 出 
的 : 


IX*] = 站 rre “dz = [ extDldz = T(k+1) = kl 
0 0 


(我 们 用 到 了 o? = E[X?] 一 正 [X]2). 
。 马尔 可 夫 不 等 式 : Prob(X > 4) < E[X]/4 = 1/4 = 0.25. 
。 切 比 雪夫 不 等 式 : Prob(X > 4 = Prob(|X -1> 关 3.1) 入 1/33 = 0.111 111. 
。 真 实 值 : Prop(X >4)= [7 e ?dz =e ~ 0.018 315 6. 

不 足 为 奇 , 切 比 雪夫 比 不 等 式 马尔 可 夫 不 等 式 的 结果 更 好 , 但 两 者 都 远 不 是 事 

实 ( 切 比 雪夫 不 等 式 的 结果 大 约 是 真实 值 的 6 倍 ). 


” 


17.4 ”布尔 不 等 式 与 邦 弗 伦 尼 不 等 式 
本 节 的 目的 是 从 容 斥 方法 (参见 第 5 章 , 尤其 是 5.2 节 ) 中 分 离 出 一 些 有 用 的 
:等 式 . 容 斥 方法 (也 称 为 容 斥 原理 ) 是 精确 的 , 但 是 通过 “截断 ” 求 和 , 我 们 可 以 
得 到 上 界 和 下 界 . 在 进行 截断 之 前 , 让 我 们 回忆 一 下 这 个 陈述 . 


容 斥 方法 : 设 41,… ,4n 是 一 组 有 限 多 个 集合 . 那么 


Prob (U 4 > >》， Prob( A;, ) >》， Prob( Aj;, NN Ai,) 
i=1 1&il&n 1<ii<io<n 


毕 >》, Prob(Ai, NM Ai, N Ai,) 


1<il<i2o<is&n 


一 … .十 (—1)”*+!Prob(Ai (NN An). 


这 个 证 明 是 通过 仔细 记录 得 到 的 . 我 们 考察 元 素 x 的 计数 频率 , 发 现 它 在 等 式 
两 端 出 现 的 次 数 是 相同 的 . 如 果 回 顾 一 下 这 个 证 明 , 我 们 会 看 到 当 把 右 端的 和 截断 
时 会 发 生 什么 . 如 果 在 正 号 之 后 截断 , 那么 我 们 可 能 会 对 某 些 元 素 进行 了 多 次 计算 ， 
并 且 没 有 通过 删除 来 做 出 调整 . 因此, 如果 我 们 在 一 个 正 号 之 后 截断 , 那么 得 到 的 
答案 就 是 4; 并 的 概率 上 界 . 由 于 下 一 项 是 负 的 , 所 以 这 个 结果 确实 是 上 界 , 这 意味 
着 我 们 得 到 的 答案 可 能 太 大 了 . 

类 似 地 , 我 们 也 可 以 在 一 个 负 号 之 后 截断 . 此 时 , 我 们 只 是 避免 了 过 度 计 算 . 但 
现在 的 危险 是 , 我 们 可 能 重复 删除 了 一 些 元 素 . 在 这 种 情况 下 , 我 们 可 能 少 算 了 , 现 
在 得 到 的 是 并 集 真实 概率 的 下 界 . 同样 地 , 因为 下 一 项 是 正 的 , 所 以 这 的 确 是 一 个 
下 界 , 表明 我 们 删 掉 了 过 多 项 . 

现在 提取 新 的 不 等 式 
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布尔 不 等 式 : 我 们 有 


Prob (DU 4 < Si 
i=1 


= 


对 于 可 数 多 个 4;, 这 个 结果 仍然 成 立 . 
在 陈述 邦 弗 伦 尼 不 等 式 之 前 , 先 引 入 一 些 有 用 的 符号 . 设 
Sk 一 >》， Prob(A;, 门 Ai, 站 … 门 Ai, ). 


1 人 攻 于 人 信 长 轴 
也 就 是 说 , 所 有 可 能 的 大 个 4 的 交集 的 概率 之 和 就 是 5;. 注意 , 这 里 有 (7) 个 加 
数 . 


邦 弗 伦 尼 不 等 式 : 对 于 上 述 Si 以 及 正 整 数 ! 和 mm, 我 们 有 


2 也 2m—1 
D(C-D)* Ss < Prob (U 4 < > (—1)*-1S;. 


k=1 = 


例如 , 假设 有 4 个 人 , 计算 至 少 有 一 个 人 拿 到 13 张 相同 花色 的 牌 (来 自 一 副 标 
准 牌 ) 的 概率 边界 . 如 果 让 A; 表示 第 i 个 人 拿 到 了 一 手相 同 花 色 的 牌 (1 < i < 4， 
那么 


Prob(Ai) = (WW (3) 


( 记 住 , 一 副 牌 有 4 种 花色 , 所 以 拿 到 同一 种 花色 的 方法 有 4 种 ). 事件 4 nn 47 表 
示 第 i 个 人 和 第 ; 个 人 都 拿 到 了 一 手相 同 花 色 的 牌 ; 当 i 了;j 时, 我 们 有 


9. /13Y /13 
sr 


这 是 因为 , 把 一 种 花色 分 配给 第 ; 个 人 , 并 把 另 一 种 花色 分 配给 第 ; 个 人 的 方法 共 
有 4.3= 12 种 (他 们 分 别 拿 到 了 哪 1 种 花色 是 很 重要 的 ). 于 是 
人 
E> "ob(4) = 4. 0665307475 
4\ 4.3.(13) (3) 1 
SE Pode) (0 加 055821651 


1<i<j<4 


使 用 最 简单 的 邦 弗 伦 尼 不 等 式 , 我 们 得 到 了 
S$1— S52 < Prob (Ua < 8, 


[ 
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其 中 S1 和 Ss 如 上 所 述 . 如 果 你 想 看 一 看 实际 的 数 , 它 就 是 


4 
0.000 000 000 025 1842 < Prob (L 4 < 0.000 000 000 025 196 4. 


i=1 


关于 上 面 的 论述 , 特别 好 的 一 点 是 , 我 们 能 很 快 得 到 答案 . 另外 , 我 们 不 仅 得 
到 了 接近 于 真实 答案 的 边界 , 而 且 可 以 量化 它们 之 间 有 多 接近 (上 界 和 下 界 相差 了 
52, 而 且 S52 比 51 小 很 多 )! 


17.5 收敛 类 型 


在 陈述 17.6 节 的 弱 大 数 定 律 和 强大 数 定律 之 前 , 我 们 需要 描述 不 同 的 收敛 类 
型 . 弱 大 数 定律 和 强大 数 定律 考察 的 是 (适当 标准 化 的 ) 独立 随机 变量 之 和 的 性 质 . 
事实 证 明 , 很 多 情况 都 与 极限 有 关 . 我 们 想 讨 论 一 下 , 可 以 从 和 中 得 到 一 个 结果 的 
各 种 方法 . 下 面 的 讨论 旨 在 引入 术语 , 并 使 其 易于 理解 . 要 想 严 说 地 把 握 这 个 主题 ， 
还 需要 熟知 分 析 学 的 知识 , 此 处 不 作 要求 . 


17.5.1 ” 依 分 布 收敛 


a 


依 分 布 收敛 (或 弱 收 剑 ): 设 XX,X1, X2,..， 都 是 随机 变量 , 它们 的 累积 分 布 函数 
分 别 是 ,也 , 羽 ,…. 设 C 是 由 古 的 连续 点 构成 的 实数 集 . 如 果 lim，,。 R(x) = 
F(z) 对 所 有 的 z eC 均 成 立 , 那么 随机 变量 序列 Xi XX2,… 依 分 布 收敛 (或 弱 收 
敛 ) 于 随机 变量 X， 换 句 话说, 如 果 下 在 x 处 是 连续 的 , 那么 累积 分 布 函数 列 
在 x 处 的 极限 就 等 于 F(z)， 这 一 结论 通常 被 记 作 X,, 到 X 或 者 XXX. 
如 果 知 道 随机 变量 X 的 类 型 , 我 们 有 时 会 把 X 替换 成 它 服从 的 分 布 . 因此 , 用 
XX。 轧 N(0,1) 表示 收敛 于 一 个 服从 标准 正 态 分 布 的 随机 变量 , 用 X,, 印 Exp(2) 
表示 收敛 于 一 个 服从 参数 为 2 的 指数 分 布 的 随机 变量 


事实 上 , 这 是 最 弱 的 一 种 收敛 , 它 强 含 在 其 他 所 有 类 型 的 收敛 中 . 
我 们 来 看 个 例子 ， 设 X,, 是 一 个 服从 均匀 分 布 的 随机 变量 ， 其 概率 密度 函 
1 


he { 1 2 n—2 —} 

3 三江 0， 的 人 ) 

f(t)= 7 nn Nn Nn 
下 其 他 . 


下 标 n 是 为 了 强调 我 们 有 n 个 非 零 值 , 这 些 值 是 均匀 间隔 的 , 参见 图 17-1 中 的 
PDF 和 CDF 图 形 . 
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0.20 
0.15 
0.10 
0.05 
1 1 1 1 
0.2 0.4 0.6 0.8 
1.0F 
0.8 上 
0.6| Wy 
0.4[ 
0.2 上 | 
ER | 和 和 
0 05 0.5 1.0 1.5 2.0 


图 17-1 当 n= 10 时, 离散 均匀 分 布 的 PDF( 上 图 ) 和 CDF( 下 图 ) 


。 从 概率 密度 函数 中 不 难看 出 , 对 于 任意 的 ze [0,1], 都 有 limn f(x) = 0. 
考察 这 一 点 最 简单 的 方法 是 , 除了 n 个 特殊 值 外 , f(z) = 0 对 其 余 所 有 xz 
均 成 立 . 当 xz 取 任 意 特殊 值 时 , f(z) 都 等 于 1/n. 随 着 n 的 增加 , 这 个 值 会 
减 小 到 0. 

CDF 的 情况 则 截然 不 同 . 当 xz € [0,1] 时 , F(x) 等 于 士 乘 以 {0,1/n,2/n,…， 
(n 一 1)/n} 中 不 大 于 xz 的 值 的 个 数 . 这 是 因为 CDF 等 于 随机 变量 不 大 于 x 
的 概率 . 对 于 任意 的 z € [0,1], 


1 nz 
ms TF 
0<k<n—1 % 
k/ngo 


其 中 , 地 板 函 数 |y| 表示 不 超过 y 的 最 大 整数 . 因为 |y| 与 y 最 多 相差 1, 所 
以 nz 一 1< |nz| < nz, 于 是 有 
1 


Z 一 二 < P(r) < ZY. 
n 


当 取 极限 n 一 co 时 , lim_w F(z) = zx. 这 正 是 服从 [0,1] 上 均匀 分 布 的 随 
机 变量 的 累积 分 布 函数 ， 


我 们 证 明了 X 对 Unif(0,1). 另外 , 我 们 还 看 到 了 这 种 收 剑 被 称 为 弱 收 全 的 原 
因 : 概率 密度 函数 没有 收敛 到 均匀 分 布 的 概率 密度 函数 . 乍 一 看 , 这 应 该 会 令 人 感 
到 失望 , 但 是 从 很 多 方面 来 说 还 不 算 太 糟 . 回想 一 下 , 我 们 可 以 利用 累积 分 布 函数 
来 计算 事件 的 概率 . 例如 , 随机 变量 在 区 间 fo, 避 上 取 值 的 概率 是 F(5) ~ F(a)， 因 
此 , 当知 道 CDF 时 , 我 们 仍然 可 以 做 很 多 事情 . 也 就 是 说 , 这 个 例子 清楚 地 表明 了 
我 们 需要 寻找 更 强 的 收敛 


17.5.2 ” 依 概率 收敛 


依 概率 收敛 : 设 X,X1, X2,… 都 是 随机 变量 . 如 果 对 于 任意 的 e > 0, 都 有 


lim Prob(lX 一 XI >6 = 0， 


那么 说 序列 {XX}o2_1 依 概率 收敛 于 X, 并 记 作 X, 马 六 或 者 X, 上 六 


本 书 只 考察 X 是 常数 随机 变量 时 的 依 概率 收敛 . 这 意味 着 , 存在 某 个 常数 c 
使 得 Prob(X = c) = 14. 我 们 和 常 把 这 个 分 布 记 作 6.. 

设 Xi ~ N(1701,1/r2)( 所 以 X 服从 均值 为 1701 上 且 方 差 为 1/m? 的 正 态 分 布 ). 
我 们 断言 Xn 己 51701. 为 了 证 明 这 个 结果 , 必须 证 明 对 于 任意 给 定 的 。> 0, 有 


lim Prob(|X, -1701 >e = 0 


(我 们 把 X 替换 成 了 1701, 这 样 做 的 原因 是 X 等 于 1701 的 概率 是 1). 注意 , 这 个 
式 子 看 起 来 很 像 切 比 雪 夫 不 等 式 ; 


1 


Prob(|Xn, 一 1701| 2 kon) < 7: 


为 了 利用 这 个 不 等 式 , 只 需要 找到 满足 ko =e 的. 由 on = 1/n 可 知 ,大 = ne. 于 


是 


Prob(|X, —1701| > 6) < ——. 
Nn 


由 于 e 是 固定 的 , 当 一 ce 时 , 可 以 看 到 上 式 趋 向 于 0, 这 样 就 完成 了 依 概 率 收敛 
的 证 明 . 


17.5.3 “几乎 必然 收敛 与 必然 收敛 


最 后 两 个 收敛 概念 需要 用 到 更 多 的 分 析 学 知识 ， 我 们 只 是 出 于 完整 性 对 其 进 
行 阐述 
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[nl) 


县. 


如 果 


晤 | 


Ce 


几乎 必然 收敛 : 设 (9, ,Prob) 是 一 个 概率 


Prob(w EQ: lim Xn(w) = X(w)) 


那么 说 {Xn}32i1 几 乎 必然 (或 者 几乎 处 处 , 又 或 者 以 概率 1 收敛 于 X)， 


空间 , 设 X, Xi1, X2,… 都 是 随机 变 


1 


2 


并 记 作 


必然 收敛 : 设 (Q, 下 ,Prob) 是 一 个 概率 
果 对 于 所 有 的 we Q, 均 有 


2 


Pr 


E 间 ,， 设 X, Xi X2 都 


im Xn(w) = X(w)， 
那么 说 {Xn}?21 必然 收敛 于 X. 
17.6 ” 弱 大 数 定律 与 强大 数 定律 
这 里 的 两 个 结果 描述 了 一 个 非常 特殊 的 随机 变量 序列 的 收敛 性 如果 Xi， 
X2, 都 是 随机 变量 , 那么 令 随机 变量 
X= 一 十 二 
表示 前 n 个 随机 变量 的 平均 值 . 中 心 极限 定理 (参见 定理 20.2.2) 指出 , 在 Xi 的 适 
当 假 设 下 , 标准 化 随机 变量 2 = (XY 一 EE[ 闵 ,])/StDev(X) 会 收 化 于 标准 正 态 分 布 . 
我 们 始终 假设 随机 变量 X; 是 同 分 布 的 , 且 均 值 j 是 有 限 的 . 如 果 不 进 行 标 准 化 ， 
会 发 现 又 ,将 收敛 于 均值 为 y 日 方差 趋向 于 0 的 高 斯 分 布 . 这 意味 着 部, 非常 接 
近 于 常数 函数 j. 中 心 极限 定理 的 男 一 个 优点 是 , 它 讨 论 了 收敛 是 如 何 发 生 的 (万 
其 是 描述 了 波动 状况 ). 
本 节 将 讨论 两 个 较 弱 的 结果 , 但 对 于 许多 应 用 来 说 , 这 些 结果 已 经 足够 了 . 它 


们 就 是 弱 大 数 定律 和 强大 数 定律 . 从 某 种 意义 上 来 说 , 这 些 结果 仅仅 表明 了 部 , 收 
你 于 /我 们 不 对 波动 情况 进行 详细 描述 . 这 样 做 的 优点 是 证 明 会 比 中 心 极限 定理 
短 得 多 , 并 且 在 概率 论 入 门 课 上 是 可 行 的 ， 

弱 大 数 定律 : 设 X1, Xo, … 是 独立 同 分 布 的 随机 变量 , 且 均 信 为 /并 设 总 二 
加 +X。 那么 卫 , 台 J( 即 卫 , 依 概率 收敛 于 中， 


证 明 : 为 了 简化 说 


E 明 , 我 们 做 一 个 额外 的 假设 . 假设 随机 变量 都 有 有 限 的 方差 


02. 这 样 做 可 以 给 出 一 个 非常 简单 的 证 明 , 并 且 强 调 了 正在 发 生 的 事情 . 我 们 有 


So [XI 十 Xn 人 As nn 
Xo | | = 》 EX = = 
也 个 1 Nn 


X11 十 … 十 Xn 1 忌 no? o 
Var(X) = Var ( ) 2 Ver (Xs) SS 


因此 可 以 看 到 , 关 , 的 期 望 值 是 jy, 方差 是 o2/n. 当 nn 一 oo 时 , 方差 趋 近 于 0. 
我 们 想 证 明 XY, 依 概 率 收敛 于 常数 函数 j. 这 意味 着 , 对 于 任意 给 定 的 e > 0, 要 得 
到 


lim Prob(|X —n|2¢e) = 0. 


这 个 式 子 看 起 来 很 像 下 面 的 切 比 雪夫 不 等 式 , 即 

1 

我 们 要 做 的 就 是 蔡 换 . 现在 已 知 jx = 4 和 ox, =o/Vn, 那么 令 kox, = 6, 则 有 
二 eVn/o. 这 样 就 得 到 了 


im Prob(|X — x,|> kox,) < 


2 


lim Prob(|X, — |>e) < Ss 
Nn—00 NE 


当 nn 一 co 时 , 上 述 概率 趋 近 于 0, 结论 得 证 . 
有 必要 停 下 来 看 看 这 一 系列 结论 . 马尔 可 夫 不 等 式 给 出 了 切 比 雪夫 不 等 式 , 切 
比 雪夫 不 等 式 又 可 以 推出 弱 大 数 定律 . 关于 弱 大 数 定律 , 我 们 可 以 从 一 个 很 好 的 角 
度 来 考察 : 如 果 在 一 个 固定 分 布 中 进行 独立 抽样 , 那么 样本 均值 任意 接近 于 总 体 均 
值 /的 概率 趋 近 于 1. 
这 个 结果 的 一 个 重要 用 途 是 通过 抽样 来 估计 分 布 的 均值 . 
可 以 理解 , 如 果 有 一 个 弱 大 数 定律 , 那么 也 应 该 有 一 个 强大 数 定 律 . 强大 数 定 
律 的 证 明 更 加 复杂 , 我 们 只 陈述 该 定律 的 内 容 . 


强大 数 定律 : 设 Xi1, Xo,.…. 是 独立 同 分 布 的 随机 变量 , 且 均 值 为 凡 并 设 X,, = 


加 + -+X 那么 成 2 几 


志 


17.7 习 题 


习题 17.7.1 ”证 明 离 散 情形 的 马尔 可 夫 不 等 式 . 

习题 17.7.2 ”证 明 离 散 情形 的 切 比 雪夫 不 等 式 . 

习题 17.7.3 ”找到 一 个 分 布 , 使 马尔 可 夫 不 等 式 成 为 等 式 . 是 否 存 在 一 个 分 布 能 使 上 述 结论 
对 所 有 a 均 成 立 , 又 或 者 需要 为 每 个 a 找到 一 个 不 同 的 分 布 ? 


VW 
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习题 17.7.4 ”找到 一 个 分 布 , 使 切 比 雪夫 不 等 式 成 为 等 式 . 是 否 存 在 一 个 分 布 能 使 上 述 结论 
对 所 及 均 成 立 , 又 或 者 需要 为 每 个 大 找到 一 个 不 同 的 分 布 ? 

习题 17.7.5 ”IQ 测试 结果 的 均值 为 100, 标准 差 为 15. 求 出 IQ 值 高 于 140 的 人 所 占 比例 
的 边界 . 另外 , IQ 值 服 从 正 态 分 布 , 利用 这 一 点 来 估算 IQ 值 高 于 140 的 人 所 占 的 真实 
比例 . 然后 对 两 个 结果 进行 比较 . 

习题 17.7.6 ”在 一 个 有 30 名 学 生 的 班级 中 , 如 果 一 门 考试 的 班级 平均 成 绩 是 80%, 那么 成 
绩 高 于 95% 的 学 生 最 多 有 多 少 名 ?如 果 考 试 成 绩 的 标准 差 是 10%, 那么 成 绩 高 于 95% 
的 学 生 最 多 有 多 少 名 ? 

习题 17.7.7 “假设 一 枚 硬币 被 抛 抑 了 100 次 . 利用 切 比 雪 夫 不 等 式 , 求 出 每 次 都 搓 出 正面 的 
概率 上 界 . 把 这 个 结果 与 真实 概率 进行 比较 . 


习题 17.7.8 


那么 X 就 服从 参数 为 和。 
,1). X 至 少 是 均值 7 

找到 这 个 概率 的 边界 . 你 可 以 
习题 17.7.9 ”假设 随机 变量 X 的 前 2m 阶 


Laplace(0 


如 果 随 机 变量 X 的 概率 密度 函数 为 


jx(z) = 


/0) ， 


exp (—|z— 
3b p H 


E 确 答案 , 并 利 


马尔 可 了 


E 都 是 有 限 的 . 利 


ka) 的 边界 . 你 能 得 到 的 最 好 边界 是 多 少 ? 


习题 17.7.10 


布 ) 的 效果 如 何 . 对 了 


及 真实 值 . 
习题 17.7.11 


测试 上 一 题 的 边界 应 | 


不 同 的 , 比较 你 算出 的 边界 、 利 


的 拉 普 拉 斯 分 布 , 并 记 作 X ~ Laplace(1,0b). 假设 Y ~ 
倍 的 概率 是 多 少 ? 求 出 ; 
不 等 式 为 这 个 概率 找到 一 个 边界 吗 ? 
用 这 一 点 , 求 出 Prob(|X 一 hu| > 


用 切 比 雪夫 不 等 式 


] 于 各 种 分 布 (比如 均匀 分 布 、 指 数 分 布 、 拉 普 拉 斯 分 
j 切 比 雪夫 不 等 式 得 到 的 边界 , 以 


我 们 可 以 推广 柯 


以 挫 


识 可 


E 导 出 标准 化 常数 (好 


fx(7x) = 


分 布 来 获得 


3 


契 


tt 


数量 矩 的 随机 变量 


mm 1 


2r csc(m/m) 1+|z on™ 
那么 说 X 服从 参数 为 jy 和 m > 1/2 的 广义 柯 西 分 布 . 利 


j 复 分 析 和 国 


E 少 适 


也 可 以 算出 它 : 
Integrate[2/(1 + x* (m)), {x, 0, Infinity}, 


Assumptions -> Element[m, Integers]] 


(如 果 你 从 未 在 Mathematica 
的 杂乱 程度 ). 

考虑 习题 17.7.9 中 的 边界 ， 并 把 这 些 边界 应 
{4, 5, 6}. 你 给 出 的 边界 与 实际 概率 相 
Ph 有 5 张 牌 , 至 少 有 


低 反 馈 旧 


习题 17.7.12 
习题 17.7.13 


习题 17.7.14 


使 


j 过 假设 特性 , 那么 


EE 


比如 何 ? 


旦 . 如 果 随 机 变 


EX 


道 积分 的 相关 知 


每 人 


个 人 拿 到 | 


设 X 是 一 个 随机 变量 , 它 和 


= 
| 


同 分 布 于 参数 为 和 的 指数 分 布 , 订 


E 明 : > a.s. 


昌 于 很 多 m), 不 过 Mathematica 和 Wolframe/Alpha 


于 X ~ Cauchy(0,m)， 其 中 me 


质子 的 概率 上 界 和 下 界 分 别 是 多 少 ? 

的 CDF 被 定义 为 : 当 z 关 0 时 F(z) = 1 一 (1 一 全 )”， 
否则 瓦 (z) = 0. 证 明 : X 吃 Exp(1). 
设 Xi, X2,… 相互 独立 且 


入. 


习题 17.7.15 ”证 明 : 依 概 率 收敛 蕴含 着 依 分 布 收敛 . 
习题 17.7.16 ”证 明 : 几乎 必然 收敛 丝 含 着 依 概 率 收敛 . 
习题 17.7.17 ”对 于 一 个 有 20 支 球 队 的 棒球 联盟 , 其 平均 获胜 概率 是 50%, 标准 差 是 10%. 
有 完美 赛季 的 球 队 最 多 有 多 少 支 ? 
习题 17.7.18 ”如 果 一 座 图 书馆 有 25 000 美元 的 预算 购买 图 书 , 而 一 本 书 的 平均 价格 是 15 
美元 , 标准 差 是 5 美元 , 那么 我 们 能 否 找 到 图 书馆 可 以 购买 图 书 数量 的 上 界 ? 解释 为 什么 
能 或 不 能 . 
习题 17.7.19 ” 弱 大 数 定律 的 一 个 条 件 是 随机 变量 
地 方 用 到 了 这 一 点 . 给 出 变量 不 独立 时 的 反例 . 
习题 17.7.20 “证明 : 强大 数 定律 上 缠 仿 着 弱 大 数 定律 . 
习题 17.7.21 ” 求 出 100 颗 6 面 山 子 折 出 的 数字 和 至 少 为 400 的 概率 边界 . 
习题 17.7.22 ” 设 Xi,X2,… ,Xi 是 n 个 独立 同 分 布 的 随机 变量 ， 且 均值 为 wy， 计算 
E[X+X2++Xn]. 
习题 17.7.23 ” 康 托 尔 集 是 把 区 间 [0, 1] 进行 三 等 分 , 并 去 掉 中 间 的 一 段 , 然后 递 推 地 从 每 个 
剩余 区 间 中 移 除 中 间 1/3 而 得 到 的 . 从 [0, 1] 中 均匀 选 出 的 一 个 数落 在 剩余 区 间 的 概率 
记 作 Cu. 证明: C， 依 概 率 收 敛 于 0. 
习题 17.7.24 ”虽然 康 托 尔 集 有 其 他 性 质 , 但 特别 有 趣 的 是 , 它 包 含 了 无 限 不 可 数 个 点 (参见 
上 一 题 ). 找 出 一 个 从 康 托 尔 集 映射 到 区 间 [0,1] 的 满 射 . 也 就 是 说 , 找到 一 个 表达 式 , 将 
[0, 1] 中 的 每 个 实数 与 康 托 尔 集中 至 少 一 个 数 联系 起 来 . (提示 : 把 康 托 尔 集中 的 数 转化 成 
3 进 制 来 考察 , 然后 试 着 把 它们 映射 到 2 进 制 下 的 实数 . ) 
习题 17.7.25 ”从 康 托 尔 集中 选 出 一 个 数 的 概率 能 否 指 定 为 均匀 分 布 的 概率 ? 如 果 可 以 , 请 
给 出 一 种 方法 . 
17.7.26 ” 画 出 me {1,2,… ,20} 的 Cn, 并 对 Cn 收敛 于 0 的 速度 做 出 评价 . 
17.7.27 “如 果 四 阶 矩 是 有 限 的 , 那么 一 阶 和 矩 、 二 阶 矩 和 三 阶 窍 都 必须 有 限 吗 ? 
17.7.28 ”假设 六 的 四 阶 矩 是 有 限 的 . 找到 一 个 使 用 四 阶 托 的 切 比 雪夫 定理 的 推广 . 
17.7.29 ”洋基 队 正 处 于 低迷 的 一 年 . 在 这 一 年 里 , 对 于 任何 一 场 比赛 , 他 们 只 有 20% 
的 概率 击败 红 袜 队 . 他 们 今年 与 红 袜 队 共 打 了 18 场 比赛 . 利用 马尔 可 夫 不 等 式 和 切 比 雪 
夫 不 等 式 , 求 出 红 袜 队 在 今年 的 每 场 比赛 中 都 击败 洋基 队 的 概率 上 界 . 有 足够 的 信息 来 
找到 真实 概率 吗 ? 为 什么 有 或 为 什么 没有 ? 如 果 有 , 找 出 这 些 信息 . 
习题 17.7.30 对 夫妻 为 购买 新 公寓 准备 了 100 000 美元 的 预算 . 公寓 的 平均 售 价 为 40 000 
二 元 ,标准 差 为 5000 美元 . 利用 切 比 雪夫 不 等 式 , 求 出 这 对 夫妻 遇 到 一 套 超 出 预算 的 公 
寓 的 概率 上 界 . 有 足够 的 信息 来 找到 真实 概率 吗 ? 为 什么 有 或 为 什么 没有 ? 如 果 有 , 找 出 
这 些 信 息 . 
习题 17.7.31 副 标 准 牌 共有 52 张 , 你 拿 到 了 其 中 5 张 . 利用 马尔 可 夫 不 等 式 , 求 出 在 你 
拿 到 的 5 张 牌 中 , 红 桃 不 少 于 4 张 的 概率 上 界 . 有 足够 的 信息 来 找到 真实 概率 吗 ? 为 什 
么 有 或 为 什么 没有 ? 如 果 有 , 找 出 这 些 信息 . 
习题 17.7.32 ”现在 有 50 颗 山 子 . 利用 马尔 可 夫 不 等 式 与 切 比 雪夫 不 等 式 , 求 出 这 50 颗 均 
匀 山 子 至 少 撕 出 25 个 6 的 概率 上 界 . 有 足够 的 信息 来 找到 真实 概率 吗 ? 为 什么 有 或 为 


必须 是 相互 独立 的 . 请 解释 在 证 明 中 哪个 


Rd 


Rd 


| 


| 
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什么 没有 ? 如 果 有 , 找 出 这 些 信息 . 
习题 17.7.33 ” 设 X。 服从 参数 为 入 = 和 /n 的 几何 分 布 , 并 设 丈 = 二 Xn. 证 明 : Y 收敛 
于 Exp( 和 ). 为 什么 要 考察 丈 ， 而 不 是 X? 
习题 17.7.34 ” 设 R(1,0”) 是 均值 为 1 上 且 方 差 为 有 限 值 o? 的 随机 变量 , 并 设 X， ~ 入 (2/ 
n2). 证 明 : Xn 忆 6 
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在 没有 阶乘 的 情况 下 研究 概率 是 可 行 的 , 但 你 必须 做 很 多 工作 来 避免 它们 . 记 


住 nl 是 前 ”个 正 整数 的 乘积 , 而 且 我 们 约定 0! = 1. 


内 此 31 =3.2.1=6 上 是 


4 二 4.3! = 24. 有 个 很 好 的 组 合 学 解释 : ml 表示 把 n 个 人 有 序 排 成 一 列 的 方法 数 


(第 一 个 人 有 n 种 选择 , 第 二 个 人 有 n 一 1 种 i 


就 可 以 解释 0! = 1 意味 着 什么 都 不 安排 的 六 
阶乘 无 处 不 在 , 有 时 以 明显 的 方式 出 现 


在 概率 论 中 的 例子 是 有 序 地 排列 对 象 , 紧 接着 我 们 又 讨论 
系数 (7) = meery 指 的 是 从 nn 个 对 每 
但 是 , 这 里 的 阶乘 函数 并 不 十 分 明显 . 


， 有 时 隐藏 在 某 个 地 方 . 阶乘 首次 出 现 


和 有 了 这 个 观点 , 我 们 


最 隐蔽 


FP 无 序 地 选 出 个 
的 一 种 情况 可 能 发 生 在 标准 正 态 


了 无 序 时 的 情况 (二 项 式 
的 方法 数 ) 


分 布 的 概率 密度 函数 中 , 即 大 exp(-z2/2)， 事实 上 , Vx = (1/2)!， 当 读 到 这 里 


时 , 你 心里 应 该 响起 了 警报 声 . 毕竟 , 我 人 


门 己 经 定义 了 整数 输入 的 阶乘 函数 , 但 现在 


取 阶 乘 的 不 仅仅 是 负数 , 还 是 一 个 负 的 有 理 数 ! 这 是 什么 意思 呢 ? 我 们 该 如 何 理解 
一 1/2 的 阶乘 ? 对 把 -1/2 个 人 排 成 一 列 的 方法 数 提问 是 什么 意思 ? 


对 这 个 问题 的 回答 要 用 到 人 徊 马 函 数 , 即 


工 (s)， 


件 马 函数 : 伽 马 函 数 T(s) 是 


虽然 看 起 来 不 一 样 , 但 这 两 个 表达 式 没 什么 
换 时 , 测度 变换 有 多 好 : 对 于 固定 的 a, 如 果 月 


区 别 . 写成 dz/z 可 以 强调 在 进行 变量 替 
有 z 来 替换 雯 = az, 那么 dz/z = du/u. 


实际 上 , 伽 马 函 数 推广 了 阶乘 函数 : 如 果 n 是 一 个 非 负 整数 , 那么 T(n+1) = nl. 


我 们 在 第 15 章 中 描述 了 伽 马 函 数 的 
I(1/2) = Vz 的 几 个 证 明 . 


应 用 


上 述 局 


E 质 以 及 其 他 一 些 性 质 , 还 讨论 了 关于 


本 章 的 目的 是 描述 当 n 较 大 时 , 取 n! 近似 值 的 斯 特 林 公式 , 并 讨论 一 些 相关 
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斯 特 林 公 式 : 


n 一 co 时 , 我 们 有 


1 


1 


139 


12n 


288n2 


51 840n3 


每 当 看 到 一 个 


是 否 合 


公式 时 , 你 都 应 该 


尝试 一 些 简单 


的 测试 , 看 看 它 是 


可 以 
所 以 


个 估 


改 人 


显 人 


就 


| 


们 显然 


大 


| 么 样 的 测试 ? 斯 特 林 公 


汰 有 nl < nn. 


多 


这 与 斯 特 林 公 式 一 致 . 但 是 


2rm. 因为 ml = 
果 斯 特 林 公式 是 


个 


\ 式 断言 了 nl As me 
是 , 如 


大 粗糙 了 ， 


有 nl n(n 1):: 


因为 它 太 大 了 , 这 是 
33( 为 方便 起 见 , 不 妨 设 n/2 是 但 


理 . 我 们 
n(n—1)..…:1 
正确 的 , 那 这 


》 


还 需要 考虑 en 的 近似 . 下 界 是 什么 呢 ? 我 
有 有数), 所 以 nl > (n/2)™2. 


象 nm/22 一 m/2 根据 


斯 特 林 公式 , n 的 


虽然 这 是 一 个 下 界 ， 却 很 粮 粹 
窜 应 该 是 n 而 不 是 n/2. 有 种 巧妙 


， 因为 它 看 起 来 


的 方法 可 以 找到 漂亮 的 基本 上 下 界 . 这 是 更 高 级 


的 话题 , 要 求 我 们 对 如 何 继续 进行 
. 所 以 , 为 了 不 中 断 流程 , 我 人 
道 如 何 计数 , 我 们 就 能 
改 哪些 检验 ? 好 的 , (n 
息 : 


‘ 心 \» 


技能 
坚 到 只 要 知 
还 可 以 
出 了 什么 信 


广 


(n+1)! 罗 


(n+ Dntle-(nty) 


下 去 有 一 定 的 “感觉 ”. 不 管 怎样 , 这 都 是 很 棒 的 
] 暂 时 搁置 这 些 更 基本 的 边界 , 你 会 在 18.5 节 了 
非常 接近 斯 特 林 公式 ! 

十 1)1/n!==n 十 1. 我 们 来 看 一 下 斯 特 林 公式 都 给 


2x(n + 1) 


1 


Te 一 mV2T7 
n 二 1 
V nn 


e 


当 nn 一 oo 时 , (1 十 1/n)” 一 e( 这 是 
因此 , 上 式 的 近似 值 基 本 
致 的 ! 


FF 是 (n 十 1):e. 


y(t) . 
.3 节 的 结尾 ) 且 Vi+1/n 一 1. 


WA 
义 , 参 
3 十 1, 这 与 我 们 想 要 的 结果 是 


e 的 定 


3 加 


虽然 上 而 的 论述 不 是 证 明 , 但 


几乎 与 证 ] 样 的 价值 . 在 看 到 一 个 公式 后 ， 


能 了 解 它 在 说 什么 以 及 它 是 否 


弓 碟 口 


成 立 是 至 关 重 要 


的 . 通过 一 些 简单 的 检验 , 我 们 可 以 


上 上 


得 到 斯 特 林 公式 的 上 下 界 . 男 外 ， 


斯 特 林 公式 与 (nw 十 1)1 = (rn 十 Dn! 是 一 致 的 . 这 


全 


让 我 们 有 理由 相信 所 做 的 选择 是 


是 看 到 这 里 的 比值 与 n+1 有 多 接近 


EW 


时 . 


有 的, 尤 


过 时 
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注 虽然 18.6 节 给 出 了 斯 特 林 公式 的 完整 证 明 , 但 在 入 门 课程 中 , 你 不 应 该 
专注 于 严格 证 明 . 真正 重要 的 是 (1) 能 够 使 用 这 个 结果 , 以 及 (2) 了 解 它 为 什么 成 
立 . 我 非常 喜欢 模糊 预测 . 数 和 函数 不 应 该 那么 神秘 , 我 们 要 对 它们 的 取 值 有 一 定 
的 了 解 . 这 就 是 本 章 为 什么 要 在 斯 特 林 公式 的 近似 值 方面 给 出 很 多 论述 . 花 时 间 研 
读 这 部 分 内 容 是 值得 的 . 你 会 了 解 到 正在 发 生 什么 , 从 而 不 会 受到 大 量 技术 细节 的 
困扰 . 当然, 知道 证 明 过 程 是 很 好 的 , 对 结果 进行 证 明 能 让 我 们 识别 它 与 其 他 结论 
的 不 同 . 这 就 是 我 们 为 什么 又 给 出 了 完整 的 证 明 , 并 说 明 还 需要 做 些 什么 来 充实 框 


架 . 


18.1 斯 特 林 公式 与 概率 


在 深入 了 解 斯 特 林 公式 的 证 明细 节 之 前 , 我 们 先 来 看 看 如 何 使 用 它 . 第 一 个 问 
题 的 灵感 来 源 于 一 种 让 许多 学 生 感到 惊讶 的 现象 . 假设 有 1 枚 均匀 的 硬币 , 它 掷 出 
正面 和 反面 的 概率 各 占 一 半 . 如 果 抛 掷 2n 次 , 我 们 预计 会 得 到 n 个 正面 . 所 以 , 当 
抛掷 200 万 次 时 , 预计 会 出 现 100 万 个 正面 . 但 事实 证 明 , 当 n 一 co 时, 抛掷 一 枚 
均匀 的 人 硬币 2n 次 , 恰好 出 现 ”个 正面 的 概率 趋 近 于 0! 

这 个 结果 看 起 来 很 惊人. 在 2n 次 抛 扼 中 , 出 现 正 面 的 期 望 数 是 n, 得 到 ”个 
正面 的 概率 却 趋向 于 0? 这 是 怎么 回 事 ? 如 果 这 是 期 望 值 , 那么 它 不 应 该 很 有 可 能 
发 生 吗 ? 理解 这 个 问题 的 关键 是 要 注意 , 在 2n 次 抛掷 中 , 虽然 出 现 正面 的 期 望 值 
是 n, 但 标准 差 是 Vn/2. 回 到 抛掷 200 万 次 的 情况 , 我 们 预计 会 出 现 100 万 个 正 
面 , 但 其 波动 幅度 是 700. 如 果 现 在 把 硬币 抛 扼 2 万 亿 次 , 那么 预计 有 1 万 亿 个 正 
面 , 而 波动 幅度 约 为 700 000. 伴随 着 n 的 增加 , 描述 可 能 出 现 结果 的 均值 “窗口 ” 
会 像 标准 差 那样 增长 , 也 就 是 说 , 它 像 Vn 那样 增长 (直到 某 些 常数 ). 因此 , 概率 所 
对 应 的 取 值 会 越 来 越 多 , 这 样 就 使 得 单独 一 个 特定 结果 (比如 恰好 出 现 ”次 正面 
的 概率 不 断 下 降 . 总 而 言 之 : 随 着 概率 履 盖 的 集合 越 来 越 大 , 2n 次 抛掷 中 恰好 出 现 
n 个 正面 的 概率 就 会 不 断 下 降 . 现在 , 我 们 用 斯 特 林 公式 来 量化 这 个 概率 的 下 降 速 
度 . 


es 


Ne 


= 


对 于 取 值 较 大 的 n, 我 们 可 以 利用 斯 特 林 公 式 来 轻松 地 近似 由 记 住 , 我 们 正 
在 努力 回答 下 面 这 个 问题 : 抛掷 一 枚 均匀 的 硬币 2n 次 , 恰好 得 到 ”个 正面 的 概 


率 是 多 少 ? 
答案 可 以 很 轻松 地 写 出 来 ; 就 是 
ph /2 /IN /NY /2ny 1 
台 好 出 现 1 个 正面 = (2) (9) 目 中 去 
原因 是 , 在 22” 个 可 能 的 结果 中 , 每 一 个 结果 出 现 的 概率 都 是 相等 的 , 并 且 恰好 出 
现 n 个 正面 的 结果 共有 (2?) 个 . 另外 , 也 可 以 把 第 二 个 (1/2)” 看 作 (L _ 1/2)2n-m 


i 


Prob( 在 2n 次 抛 撕 中 1 


Ne 
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那么 (2n) 是 多 大 ? 


是 时 候 使 用 斯 特 林 公 式 了 . 我 们 有 
2n (2n)! 
人 


(2n)2"e— 2 V2n. 2n 
eV2T70 nNe NV2NMnN 
92n 
Vn 


是 


之 


导 到 nn 个 正面 


因此 , 恰好 的 概率 


2n 
n 


四 


1 


92n < 


1 


Vn 


这 意味 着 , 如 果 n = 100, 那么 得 到 一 半 1 


的 概率 略 小 于 6%. 但 是 , 如 果 n = 


1 000 000, 这 个 概率 束 会 小 于 0.06%. 


实际 上 ， 上 天 
在 纽约 州 锡 拉 丘 效 的 民主 党 初 选 中 获得 了 6001 张 选票 . 虽 
票 , 但 为 了 简单 起 见 , 我 们 假设 只 有 12 002 张 选票 . 请 问 出 现 平 
如 果 假 设 每 位 候选 人 都 等 可 能 地 获得 任何 1 张 选 票 , 答案 就 是 
确 答案 约 等 于 0.007 282 9. 利用 上 述 近似 , 结果 是 
1 


[al 


AN 


i 久 0.007 283 05， 
这 与 真实 值 非常 接近 . 
虽然 我 们 得 到 的 概率 略 低 于 1%, 但 一 些 新 闻 媒 体 报道 


分 之 一 ,有些 人 甚至 说 这 种 情况 “几乎 不 可 能 ”发 生 ， 为 什么 会 


案 ? 这 完全 取决 于 你 对 问题 如 何 建 模 . 如 果 假 设 两 位 候选 人 会 等 


张 选票 , 那么 得 到 的 答案 就 会 略 少 于 1%. 但 如 果 考 虑 其 他 信息 ， 


的 练习 类 似 于 对 2008 年 总 统 初 选 的 讨论 . 希拉 里 和 奥巴马 分 别 
然 初 选 共有 12 346 张 选 
局 的 概率 是 多 少 ? 


12 002\ /912 002 wkE 
( 6001 )/2 . 精 


说 这 个 概率 大 约 是 百 万 


有 如 此 不 同 的 答 
可 能 地 获得 每 1 


化 . 例如 , 希拉 里 当时 是 纽约 州 的 一 名 参议 员 , 所 以 不 难 想到 她 在 家 乡 的 选票 会 更 


多 


事实 上 , 她 以 57.37% 的 得 票 率 在 这 个 州 获胜 , 而 奥巴马 的 得 票 率 为 40.32%. 同 


样 地 , 为 了 便于 分 析 , 我 们 假设 希拉 里 获得 了 57% 的 选票 , 而 奥 
的 选票 .如果 把 这 些 考虑 进来 ,就 不 能 假设 每 个 选民 都 等 可 能 地 


巴 马 得 到 了 43% 


投票 给 希拉 里 或 


奥巴马 , 此 时 出 现 平局 的 概率 只 有 ("6007) .0.575007 ,0.435001. 由 


折 特 林 公式 可 得 ， 


6001 


(如 ) s22"1VTm 因此 , 在 这 些 假设 下 , 出 现 平 局 的 概率 约 等 于 
2 2 6001 6001 54 
0 

Vn 6001 


请 注意 , 概率 之 间 的 差别 取决 于 我 们 对 预期 的 不 同 假设 ! 
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18.2 ”斯 特 林 公 式 与 级 数 的 收敛 性 


斯 特 林 公 式 的 另 一 个 伟大 应 用 是 帮助 我 们 确定 使 某 个 特定 级 数 收 敛 的 z 值 . 为 
了 实现 这 个 目的 , 我 们 可 以 使 用 很 多 强大 的 微 积分 判别 法 , 例如 比值 、 根 值 和 积 4 
判别 法 . B.3 节 会 对 这 些 内 容 进 行 回顾 . 然而 , 我 们 通常 可 以 避免 使 用 这 些 判 别 法 ， 
而 是 利用 斯 特 林 公式 来 使 用 更 简单 的 比较 判别 法 . 


第 一 个 例子 是 


2 3 09 n 
了 


化 A 化 
人 


n=0 
我 们 想 知 道 当 x 取 什 么 值 时 , 该 级 数 收敛 ,由 比值 判别 法 可 知 , 无 论 > 取 何 值 , 这 
个 级 数 均 收 敛 . 也 可 以 使 用 根 值 判别 法 , 但 这 要 求 我 们 对 nl! 的 增长 有 一 定 的 了 解 . 
幸运 的 是 , 斯 特 林 公式 提供 了 这 方面 的 信息 . 现在 有 


/n 
n/n 入 (ne Vann) 一 人 


当 n 趋向 于 无 穷 大 时 , 我 们 看 到 (1/n1)*” 趋向 于 0, 那么 由 根 值 判别 法 可 知 , 收敛 
半径 是 无 穷 大 的 (也 就 是 说 , 对 于 任意 的 x, 级 数 均 收 敛 ). 

里 然 上 面 的 方法 可 以 确定 e 的 级 数 对 所 有 z 均 收 和 敛 , 但 仍然 十 分 不 令 人 满意 . 
除了 使 用 斯 特 林 公式 , 我 们 还 必须 使 用 强大 的 根 值 判别 法 . 能 否 避 免 使 用 根 值 判别 
法 , 只 利用 斯 特 林 公 式 就 可 以 确定 级 数 始终 收敛 ? 答案 是 肯定 的 , 现在 就 来 说 明 这 

我 们 想 证 明 e 的 级 数 对 所 有 z 均 收敛 . 这 里 的 思路 是 , n! 的 增长 速度 非常 快 ， 
无 论 x 取 什 么 值 , z"/n! 都 会 迅速 趋 近 于 0. 如 果 可 以 证 明 , 当 nn 充分 大 时 , 存在 某 
个 小 于 1 的 x(z) 使 得 |x?/nl| < r(z)”， 那么 由 比较 判别 法 可 知 ez 的 级 数 是 收敛 的 . 
这 里 写 r(x) 是 为 了 强调 上 界 与 x 有 关 . 为 了 更 加 清楚 , 不 妨 设 上 述 不 等 式 对 所 有 
的 n > N(z) 均 成 立 . 为 了 判定 一 个 级 数 是 否 收敛 , 我 们 只 需要 考察 后 面 的 无 穷 多 
项 , 因为 前 面 的 有 限 多 项 不 会 影响 收敛 性 . 于 是 


< 和 


三 全 : 要 A 
> nl 和 全 1 一 7r(z) 
mn 一 NOz) 7 一 NV(z) 


现在 , 问题 被 简化 成 了 证 明 : 当 n 充分 大 时 , 存在 某 个 >(z) < 1 使 得 |z*/nl| < 
7r(z)”<1. 利用 斯 特 林 公式 , 我 们 看 到 xz”/nl 与 下 面 的 式 子 相似 


加 1 (下 2 Co 
nne-nV2Am V2nn nN Nn 
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对 于 任意 一 个 固定 的 zx, 只 要 n > 2ez +1, 就 有 |ez/n| < 1/2, 这 样 就 完成 了 证 明 . 
利用 这 种 论证 方法 , 可 以 证 明 很 多 重要 级 数 的 收敛 性 . 我 们 看 一 下 标准 正 态 分 
布 的 矩 母 函数 (关于 算 母 函数 的 定义 和 性 质 , 请 参阅 第 19 章 ). 标准 正 态 分 布 的 矩 
很 容易 确定 , n 阶 矩 为 
% 1 ， (QQ2m— 1)! 若 n= 2m 是 偶数 
Li. 一 站 Zn- -er7 /2dz = 
-oo V2r 0 若 n=2m+1 是 奇数 ， 


这 里 的 双 阶 乘 指 的 是 取 遍 所 有 相隔 1 的 项 , 直到 2 或 1 为 止 . 因此 4 = 4 2， 
5 一 5.3.1 6!! = 6.4.2, 等 等 . 知 母 函数 Mx(t) 是 


Mx(t) = 2 = 2 全 f2m. 
我 们 要 和 弄 清 楚 (2m 一 lt2m/(2m)! 是 如 何 快速 减少 的 . 现在 有 
(2m— 1 (2m — 1)!! 本 1 1 
(Mm! mlm 2m:2m2)...2 2mml 


因此 , 与 之 前 一 样 , 这 个 级 数 对 所 有 的 t 均 收敛 . 事实 上 , 我 们 甚至 可 以 确定 它 收敛 
到 什么 值 : 


12™m 


sD 二 = 有 


m=0 et 
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本 节 的 技巧 性 稍 强 一 些 , 你 可 以 放心 地 跳 过 . 但 是 , 如 果 你 愿意 花 些 时 间 来 掌 
握 这 些 内 容 , 就 会 学 到 一 些 解决 概率 问题 的 有 用 技巧 , 还 会 看 到 一 个 很 常见 的 陷阱 
并 学 会 如 何 避 免 它 . 
中 心 极限 定理 是 概率 论 中 非常 重要 的 结论 之 一 . 它 指出 随 着 相互 独立 的 随机 变 
量 个 数 不 断 增加 , 这 些 变量 的 和 会 趋向 于 服从 正 态 分 布 . 作为 斯 特 林 公式 的 一 个 强 
有 力 的 应 用 , 我 们 将 证 明 斯 特 林 公 式 蕴含 着 中 心 极限 定理 的 一 种 特殊 情形 , 即 随机 
变量 XX,… , Xon 都 服从 参数 为 p = 1/2 的 伯 努 利 分 布 的 情形 ， 从 技术 角度 考虑 ， 
最 简单 的 情形 是 下 列 标准 化 形式 


1/2 若 n=1 
Prob(X; = n)= 4 1/2 若 n= 一 1 (18.1) 
0 其 他 . 


把 1 看 作 硬 币 掷 出 了 正面 , -1 看 作 掷 出 了 反面 ， 从 这 个 标准 化 形式 中 可 以 看 出 ， 
和 十 …+ 2N 的 期 望 值 是 0. 由 于 X 表示 第 站 次 掷 出 了 正面 或 反面 , 所 以 这 个 和 
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就 是 正面 比 反面 多 出 的 个 数 (期 望 值 为 0). 

设 Xi1,… ,XoN 是 相互 独立 的 随机 变量 , 且 均 服从 概率 密度 函数 为 式 (18.1) 
的 二 项 分 布 . 那么 , 每 个 变量 的 均值 都 是 0, 因为 1.(1/2) 二 (一 1) (1/2) = 0, 而 方差 
均 为 


最 后 , 我 们 令 
D2N 三 从 1 十 … 十 人 2N. 


San] = EI[Xi]+:.+ EXoN] = 0 上 + 上 +0 =0 


可 知 , Sow 的 均值 是 0. 类 似 地 , 不 难看 出 Sow 的 方差 是 2V. 因此 , 我 们 希望 Sow 
约 等 于 0, 而 波动 幅度 约 为 V2N. 
现在 看 一 下 Szw 服从 的 分 布 . 我 们 首先 注意 到 , Saw = 2k 十 1 的 概率 是 0. 这 
是 因为 Saw 等 于 出 现 正面 的 次 数 减 去 出 现 反面 的 次 数 , 而 这 个 值 始 终 是 偶数 : 如 
果 出 现 次 正面 和 2N 一 k 次 反面 , 那么 Sz, 就 等 于 2N 一 2k. 
Sow 等 于 2k 的 概率 是 (WL)( 直 NT*( 雪 YN-*. 理由 如 下 : 当 Sow 等 于 2k 时 ， 
1( 正 面 ) 比 -1( 反 面 ) 多 了 2k 个 , 并 且 1 和 -1 的 总 个 数 是 2NV， 因 此 , 我 们 有 
NN 十 kk 个 正面 (1) 和 NN 一 个 反面 (-1). 所 有 可 能 的 结果 一 共有 22 种 , 恰好 掷 出 
NN 二 个 正面 和 N 一 个 反面 的 结果 共有 (让 ) 种 ,而 每 种 结果 出 现 的 概率 均 为 
()2. 为 了 说 明 该 如 何 处 理 更 一 般 的 情形 ( 即 掷 出 正面 的 概率 为 p, 掷 出 反面 的 概 
率 为 1 一 p), 我 们 把 上 面 的 概率 写成 ( 芭 )X+A (一 

现在 用 斯 特 林 公式 来 近似 (RY). 我 们 有 


( 2N ) (2N)2ve-2vV2r .2N 
N+k) (N+ENtRe-(N+tk) /2n(N EN — kN-Re-(N-k) /2n(N — Kk) 


TT 


本 (2N)2N N 
(NFRNME(N— kN-EN an(N+ EN—E) 
22N 1 

VC 和 JSA 人 一 B)N+3-k 
剩 下 的 部 分 就 是 做 一 些 代数 运算 来 证 明 这 个 随机 变量 收敛 于 正 态 分 布 . 不 幸 的 是 ， 
在 处 理 因子 时 ， 人 们 经 常会 掉 进 一 个 常见 的 陷阱 ， 为 了 避免 将 来 出 现 这 样 的 问题 ， 
我 们 先 描 述 这 个 常见 错误 , 然后 完成 证 明 . 

我 们 想 利用 ez 的 定义 (参阅 B.3 节 的 结尾 ) 来 推导 : 当 N 一 co 时 , (1 + $$ ~ 

ew, 然而 必须 小 心 一 点 , 因为 值 会 随 着 N 增长 . 例如 , 我 们 可 能 会 认为 (1+ 和 6) 一 
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et 日 (1— 一 e*, 这 样 两 个 因子 就 相互 抵消 了 . 因为 有 相对 于 NN 较 小 , 所 以 
我 们 可 能 会 忽略 1/2, 并 给 出 


EN” RN 
= < /N ， 
(+ 国 (+ 国 一 € ; 


类 似 地 , 有 (1 一 各 )-* 一 er**/N. 于 是 , 我 们 可 能 会 断言 ( 稍 后 在 引 理 18.3.1 中 会 看 
到 , 这 一 说 法 是 错误 的 ! ) 


k N 十 去 十 K N+#—k 
(om 


我 们 来 证 明 (1 十 羽 )"+31* (1 一 入)13* eK/N， 这 一 计算 的 重要 性 在 于 
它 强 调 了 收敛 速度 的 重要 性 . 虽然 主要 部 分 (1 土 专 )X 等 于 et 是 正确 的 , 但 误差 
项 (在 极限 中 ) 也 相当 重要 . 当 是 N 的 方 寒 时 , 误差 会 产生 一 个 很 大 的 项 . 这 里 
的 情况 是 , 由 这 两 个 因子 生成 的 项 会 相互 强化 . 另 一 种 说 法 是 , 一 个 因子 会 趋向 于 
无 穷 大 , 而 另 一 个 则 趋向 于 0. 记 住 oo.0 是 无 定义 的 表达 式 之 一 , 根据 各 项 增长 或 
衰减 速度 的 快慢 , 它 可 以 是 任何 值 . 本 节 最 后 会 给 出 更 多 说 明 

简 而 言 之 , 不 能 只 利用 (1 上 六) = ew. 我 们 要 更 加 小 心 . 正确 的 做 法 是 对 两 
个 因子 取 对 数 , 并 用 泰勒 公式 展开 ， 然后 做 指数 运 租 这 样 我 们 就 能 更 好 地 处 理 误 
差 项 . 

在 做 这 些 之 前 , 我 们 需要 大 致 了 解 上 的 重要 取 值 范围 是 什么 ， 因 为 标准 差 是 
V2N, 所 以 预计 唯一 真正 重要 的 是 那些 与 0 相距 几 个 标准 差 的 值 . 也 就 是 说 , 大 
的 最 大 值 会 比 V2N 略 大 . 我 们 可 以 利用 切 比 雪夫 不 等 式 (定理 17.3.1) 来 仔细 地 量 
化 需要 研究 多 大 的 k， 由 此 可 知 , 只 需 考 察 那些 | 旭 | 不 大 于 Ni+s 的 有, 这 是 因为 
SoN 的 标准 差 是 V2N. 于 是 , 由 (2N)12+e = (2NV)sStDev(S2w) 可 得 

1 

(2N)2e 


Prob(|Son — 0| > (2N)L2+e) < 


因此 , 现在 只 需要 考察 当 |k| < NWV2+19 时 , Sow = 2k 的 概率 . 
现在 来 考察 前 面 所 说 的 引 理 , 它 会 给 出 这 个 乘积 的 正确 极限 , 而 这 个 证 明 将 告 
诉 我 们 该 如 何 解 决 这 类 问题 . 


引 理 18.3.1 ”对 于 任意 的 ce<< 1/9, 当 |h| < (2N)!/2+e 时 , 如 果 N 一 co, 那么 有 


交 N+ 十 k 有 N+#—k 
(4 *) ( 加 ey 
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证 明 : 回顾 一 下 , 当 |z| < 工时 ， 


log(1 1 


因为 假设 有 < (2N)W27, 所 以 任何 小 于 RJ/N?, RSJN? 或 kJN3 的 项 都 可 以 忽略 
不 计 . 因此 , 如 果 定 义 


玉 十 于 十 有 十 二 一 大 
于 (4 十 让 ) ( 局 让 ) 
那么 利用 B.4 节 的 大 O 符号 可 以 得 到 
1 大 N_N 十 要 十 
log Pi,N = (w+ 有 is (0 
1 有 N\ N+ 圭一 
NN 十 一 一 1 ee 
十 ( +3 ) os( 六 
1 k k2 k3 
oo eo 
1 k k2 k3 
iv (各 -站 +o( 吉 )) 
3 


1)"°tiz n 


当 e< 1/9 时 ,< (2N)12+46, 所 以 大 O 项 完全 由 N-16 来 确定 . 最 后 , 我 们 得 到 
了 


一 1/6 
Pew = ek /Neo(N )， 


结论 得 证 . 
现在 , 我 们 完成 了 Saw 收敛 于 高 斯 分 布 的 证 明 . 把 引 理 18.3.1 和 式 (18.2) 结 
合 起 来 可 得 


ZA A 
(1) ee 
(通过 仔细 地 分 析 引 理 , 我 们 会 注意 到 e-*/N 的 存在 , 这 是 我 们 快速 而 松散 的 计算 
所 遗漏 的 )， 在 这 个 例子 中 , 对 中 心 极限 定理 的 证 明 完 全 由 一 些 简单 的 代数 运算 来 
完成 ， 因 为 我 们 研究 的 是 Saw = 2k, 所 以 应 该 把 妇 写成 (2k)?/4， 类 似 地 , 因为 
SoN 的 方差 是 2N, 所 以 应 该 用 (2N)/2 来 代替 N. 虽然 这 些 看 起 来 是 不 重要 的 代 
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数 技巧 , 但 能 轻松 地 做 到 这 一 点 会 非常 有 上 


]. 


地 将 表达 式 与 猜测 值 进 行 比较 . 现在 有 


Prob(Saw = 2k) = ( 


回 


布 . 对 本 
是 2/ V27x(2N): 
由 于 我 们 的 


忆 一 下 , Sow 不 可 
样 的 事实 : Sw 为 介 
是 0” 也 必须 被 考虑 到 . 所 以 , 这 看 起 来 像 
F 较 大 的 N, 这 村 


2N 


通过 这 些小 的 调整 , 我 们 可 以 更 轻松 


2 


日 


数 的 概率 是 我 们 所 期 望 的 2 倍 , 原 


) La 6—(28)2/2(2N) 
N+k/)22N 97 (2N) 
能 是 奇数 . 在 上 述 标 准 化 常数 的 分 子 中 , 因子 2 反映 了 这 


因 在 于 “Szw 为 奇数 的 概率 


A 


是 


的 高 斯 分 布 
exp —(2k)2/2(2N). 


个 均值 为 0 日 方差 为 2N 的 高 斯 分 


绥 慢 变化 的 , 从 2k 到 2k 十 2 的 积分 基本 上 


证 明 很 长 , 现在 花 点 时 间 来 回 


明 古 


的 概率 公式 ， 


这 里 有 个 不 


18.4 


的 表达 式 看 起 来 像 一 个 高 斯 函数 . 


中 还 包含 了 二 项 式 系 数 . 利 


顾 一 下 非常 幸运 , 我 们 有 一 个 
用 切 比 雪夫 不 等 式 , 我 们 确定 了 概 


要 点 


MA 


后 利用 斯 特 林 公式 做 展开 , 并 进行 了 一 些 代 数 运算 , 从 而 使 我 们 
错 的 挑战 : 你 可 以 把 上 面 的 论述 推广 到 p 关 1/2 的 情形 吗 ? 


积分 判别 法 与 较 弱 的 斯 特 林 公式 


利用 积分 判别 法 , 我 们 来 证 明 较 弱 的 斯 特 林 公式 . 


| 


较 弱 的 斯 特 林 公式 : 设 n > 3 是 正 整 数 . 那么 
ne .ee<nl < ne em. 
正如 我 们 在 整 本 书 中 反复 提 到 的 , 每 当 看 到 一 个 公式 时 , 我 们 的 第 一 反应 应 该 
是 验证 它 的 合理 性 . 在 进行 证 明之 前 , 把 这 个 结果 与 斯 特 林 公式 ml ~ nr*e-"*V2mn 
做 一 下 比较 . 我 们 准确 地 给 出 了 主要 部 分 nm?e-", 但 没有 提 到 因子 V2rn， 需要 注 


意 的 是 这 会 造成 多 大 的 误差 . 现在 的 下 界 是 e, 而 上 界 是 en， 这 两 个 数 的 几何 


均 数 是 Ve .en( 回 
2.718Vn, 它 与 真实 答案 V2nmn 3 2.5063Vn 非常 接近 . 


忆 一 下 , > 和 y 的 几何 平均 数 是 Vag), 即 


A. 


下 面 的 思路 就 可 


完整 的 证 明 , 只 需要 对 误差 项 进行 更 
路 , 所 以 不 添加 额外 的 组 
你 可 以 查阅 欧 拉 -麦克 劳 林 公式 , 并 轻松 地 提取 出 ; 
点 是 , 我 们 的 答案 非常 接近 斯 特 林 公式 . 下 面 的 论述 很 容易 理 


上 述 讨论 的 


中 涉及 微 积 分 


以 得 到 斯 特 林 公式 . 我 们 会 利 


eVn, 而 这 个 值 约 为 
只 要 再 多 做 一 点 工作 , 沿 着 
昌 微 积分 中 的 积分 判别 法 . 为 了 得 到 


月 


好 的 控制 


了 王 
女 


节 . 这 些 细节 会 让 证 明 更 


CE 行 了 . 我 们 的 目的 是 强调 方法 和 思 
加 杂乱 . 在 读 完 本 节 剩 余部 分 后 ， 
明 


训 


完整 的 证 


解 


bd 


PF 的 积分 判别 法 , 以 及 log(1 1 


Hz) 的 泰勒 级 数 展开 , 即 
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02 3 
1 二 生计 
虽然 在 最 后 会 有 较 多 的 代数 运算 , 但 重点 是 不 要 因此 而 偏离 主题 . 也 就 是 说 , 我 们 可 


以 利用 积分 判别 法 轻松 地 对 和 做 很 好 的 通 近 . 难 
这 需要 一 些 比较 烦琐 的 记录 工作 . 我 们 会 详细 


如 何 利 
中 学 到 些 什么 . 


现在 开始 证 明 ! 设 P= nl[ 这 里 使 用 字母 P 是 因 
E 从 一 个 乘积 中 看 出 它 缠 合 


p]. 我 们 很 难 


但 从 没 见 过 黎 曼 积 


四 | 


logP = logn! 


我 们 想 上 
增 的 . 这 意味 着 


经 见 过 这 种 类 型 的 论 订 


论述 中 最 令 人 讨厌 的 间 


! 


一 个 积分 来 近似 这 个 和 . 注意 , 如 果 f(x) = logz, 那么 当 z > 工时 上 是 递 


logtdt < Dlogk :< 三 

2 
这 个 式 子 可 以 通过 考察 上 和 与 下 和 来 得 到 . 注意 , 在 证 明 
E (上 和 与 下 和 法 ), 参见 图 
了 分 


点 在 于 


介 引 


这 个 i 


量化 积分 与 和 的 接近 程度 ， 
正明 的 细 市 , 以 此 来 强调 该 


Nn 


因此 , 我 们 想 把 关于 nl 的 问题 转化 成 一 个 更 加 熟悉 的 相关 问题 . 
法 就 是 等 式 两 端 同时 取 对 数 . 原 
性 建议 : 每 当 遇 到 乘积 时 , 你 的 第 一 反应 就 该 是 取 对 数 . 
到 我 们 的 问题 , 现在 有 


18-1. 正三 


用 这 些 技巧 去 解决 问题 . 之 后 我 们 会 重新 回顾 这 里 的 论述 , 并 强调 你 应 该 从 


为 乘积 (product) 的 首 字母 是 
什么 样 的 含义 . 这 在 一 定 程 度 上 是 因为 之 
前 的 课程 中 考察 的 都 是 和 , 而 不 是 乘积 . 例如 , 在 微 积 分 中 , 我 们 总 是 遇 到 黎 曼 和 ， 


最 直接 的 做 


因 是 乘积 的 对 数 就 是 对 数 的 和 . 这 是 个 极 好 的 一 般 


logl 十 log2 十 .… 十 logn = logk. 


k=1 


el 
log tdt. 


微 积 分 基本 定理 时 , 你 已 
地 给 出 积分 范围 可 能 是 


现在 来 论述 最 难 的 部 分 . 我 们 需要 知道 logt 的 积分 是 什么 .虽然 这 不 是 标准 


函数 , 但 它 有 


来 近似 lognl. 于 是 
4 


(tlogt—t) 


nlogn—n++l < 


有 


个 相对 简单 的 原 函 数 , 即 tlogt 一 t. 找 
证 并 确保 这 是 个 原 函 数 去 


logn! < (tlogt—t) 


ntl 
t= 


首先 看 一 看 下 界 . 已 知 


nlogn—n+t+l1 < log 


在 进行 指数 运算 后 , 我 们 看 到 


nl, 


一 个 典型 的 原 函 数 很 x 
很 容易 一 一 我 们 要 做 的 就 是 求 导 .现在 可 以 用 这 个 函数 


人 验 


logn! < (n+1)log(n+1)— (n+1)— (2l0g2—2). 
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elogn—ntl ns—n., < 


4 6 8 10 
图 18-1 当 n=10 时 , logn! 的 下 界 与 上 界 


上 界 是 什么 情况 ? 在 下 面 的 论述 中 , 我 们 将 得 到 一 个 与 n 有 关 的 量 的 对 数 . 我 们 知 


道 对 数 在 0 附近 (而 不 是 无 穷 远 处 ) 的 泰勒 展开 式 我 们 , 因此 想 通 过 改写 表达 式 来 
利用 这 个 已 知 信息 . 具体 地 说 , log(n 十 1) 可 以 改写 成 log (n(1 十 1/n)). 根据 对 数 法 
则 , log (n(1 十 1/n)) 叉 等 于 logn+log(1 十 1/n). 由 log(1+w) = 4 一 ww2/2+w3/3 一 … 
可 知 , 最 后 一 个 表达 式 非 常 适合 做 泰勒 展开 . 

于 是 有 


(n+1)log(n+1)—n+1l1—2log2 
1 
= (n+1)log (人 (+ 一 风 .十 1 一 2log2 


1 
= (nl1)logn+t (n+1)log (1+3) 一 有 十 1 一 2log2 


1 1 
2n2 3n2 


1 
=nlogntlogn -nt (n+l) (3 + 


1 
< nlogn+t+logn—n+t “一 十 1 一 2log2， 


最 后 一 个 式 子 基于 以 下 两 个 事实 : 6 ) 这 是 个 交替 级 数 , 所 以 在 正 项 之 后 做 截断 会 
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对 这 个 和 做 出 过 高 的 估计 ; (2) 如 果 n> 3, 那么 哇 ! 十 1 一 2log2 <1. 做 指数 运算 
之 后 , 可 得 
nl 妆 em log7m 一 ?十 log 7 十 1 a ns,—n. 


把 上 下 界 组 合 在 一 起 , 我 们 就 证 明了 


这 正 是 我 们 想 要 的 结果 . 

注 ”注意 , 我 们 的 论述 很 容易 理解 ， 其 中 介绍 了 许多 能 够 用 来 解决 各 种 问题 
的 漂亮 而 强大 的 技巧 . 我 们 用 积分 来 代替 和 , 并 把 复杂 有 函数 log(n 十 1) 替换 成 了 它 
的 泰勒 展开 式 ， 我 们 注意 到 ,对 于 一 个 交替 级 数 ， 如 果 在 一 个 正 项 之 后 做 截断 , 那 
么 这 个 和 就 会 被 高 估 . 最 后 , 也 是 最 重要 的 一 点 是 , 我 们 已 经 知道 了 该 如 何 处 理 乘 
积 一 一 取 对 数 并 将 来 积 转换 成 和 ! 

最 后 , 我 们 简单 地 说 明 是 如 何 看 出 logt 的 原 函 数 是 tlogt 一 t 的 . 我 们 需要 一 
个 导数 为 logt 的 函数 , 遗憾 的 是 并 不 知道 有 哪个 函数 满足 上 述 条 件 . 但 是 , 现在 还 
有 希望 . 我 们 知道 乘积 的 求 导 法 则 , 所 以 , 如 果 令 g(t) = tlogt, 那么 在 对 因子 t 微 
分 时 , 就 会 得 到 logt. 不 幸 的 是 , g'(t) = logt 十 坟 = logt 二 1. 所以, 我 们 已 经 看 到 
一 点 导数 的 影子 了 . 现在 要 让 导数 值 减 1. 这 意味 着 我 们 要 从 g(t) 中 减 去 导数 为 1 
的 函数 . 这 就 很 容易 了 一 一 只 需要 减 去 t. 这 就 是 我 们 得 到 tlogt 一 t 的 方法 . 

既然 你 已 经 看 到 了 分 部 积分 法 , 那 就 去 看 一 下 欧 拉 -麦克 劳 林 公式 吧 . 它 会 产 
生 更 紧 的 上 界 和 下 界 , 你 可 以 用 它 来 证 明 斯 特 林 公式 . 


18.5 ”得 到 斯 特 林 公式 的 基本 方法 


上 一 节 利 用 积分 判别 法 得 到 了 nl 的 上 界 和 下 界 . 虽然 得 到 的 上 下 界 很 好 , 但 我 
们 必须 要 利用 两 次 微 积分 . 一 次 是 利用 积分 判别 法 , 另 一 次 则 是 引导 我 们 看 出 logt 
的 原 函 数 是 tlogt 一 t. 虽然 这 很 容易 通过 微分 进行 验证 , 但 如 果 你 没 见 过 这 种 关系 ， 
那么 这 就 是 个 真正 的 挑战 . 
本 节 将 用 一 种 相当 基本 的 方法 来 估算 斯 特 林 公式 .我们 会 尽量 避免 使 用 微 积 
分 , 而 只 采用 巧妙 的 计算 . 你 可 以 放心 地 跳 过 本 节 . 但 是 , 下 面 的 论述 强调 了 一 种 
估算 的 好 方法 , 而 这 些 思路 几乎 肯定 会 对 你 今后 遇 到 的 各 种 其 他 问题 很 有 帮助 . 随 
着 数学 知识 的 不 断 丰 富 , 你 会 真正 开始 欣赏 技巧 和 方法 而 不 是 事实 , 这 就 是 我 花 了 
页 篇 幅 对 这 些 论述 进行 扩展 的 原因 . 尽情 享受 吧 ! 
18.5.1 ”二 进 分 解 
你 能 掌握 的 最 有 用 的 技巧 之 一 是 近似 一 个 非常 复杂 的 量 . 虽然 我 们 通常 可 以 
借助 计算 机 的 蛮 力 计算 来 获得 答案 , 但 有 时 参数 依赖 性 非常 大 , 以 至 于 这 种 做 法 难 
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以 实现 . 因此 , 学 习 如 何 看 待 问题 并 在 参数 改变 时 收集 相关 信息 是 非常 有 用 的 . 


斯 特 林 公式 为 这 些 方法 提供 了 绝 佳 的 试验 场 . 回忆 一 下 , 当 


n 趋向 于 无 穷 大 


时 , 斯 特 林 公式 告诉 我 们 n! ~ me"V2rm.， 我 们 已 经 看 到 如 何 寿 


E 不 需要 做 太 多 工 


作 的 情况 下 获得 合理 的 上 界 . 那么 怎样 得 到 好 的 下 界 呢 ? 第 一 次 答 试 得 到 了 17, 这 
非常 糟糕 . 现在 , 我 们 给 出 一 种 卓有成效 的 方法 , 它 能 让 我 们 轻松 得 到 一 个 不 错 的 


下 界 . 我 们 仍 会 得 到 下 界 mw"/22-"/2, 但 会 更 详细 地 解释 整个 计算 


为 了 简化 论述 , 不 妨 设 存 在 某 个 N 使 得 ”= 2X. 如 果 不 做 这 个 假设 , 就 需要 
使 用 地 板 函 数 , 或 者 展开 更 多 的 论述 ( 稍 后 会 这 样 做 ). 使 用 地 板 函 数 会 让 公式 和 分 
析 看 起 来 更 加 复杂 , 关键 的 见解 ( 即 主要 思想 ) 则 将 被 埋没 在 毫 无 启发 意义 的 代数 


运算 中 ， 
以 在 不 陷入 细节 的 情况 下 突出 这 种 方法 . 


而 这 些 运 算 又 是 结论 成 立 所 必需 的 . 我 更 喜欢 采用 这 种 特殊 形式 , 因为 可 


此 处 的 思路 是 使 用 二 进 分 解 . 这 是 一 种 强大 的 思路 , 会 贯穿 


于 整个 数学 . 它 的 


工作 原理 如 下 : 把 原始 问题 分 解 成 两 个 较 小 的 问题 , 然后 对 这 些 问题 进行 处 理 , 并 
把 它们 的 结果 组 合 起 来 . 这 与 递 推 非常 相似 : 我 们 通过 处 理 两 个 较 小 的 问题 来 解决 
一 个 大 问题 . 当然 , 可 以 不 断 地 细 分 : 考察 两 个 更 小 的 区 间 , 对 每 一 个 进行 划分 , 然 


后 再 次 应 用 这 种 思路 . 

这 是 个 非常 重要 的 概念 , 所 以 我 们 要 慢 慢 地 仔细 研究 它 的 应 
求 出 nl=n(n 一 1).…2.1 的 边界 . 因为 每 个 因子 至 少 为 1 且 最 多 
平凡 边界 开始 考察 , 即 


lI” <n!l < rn,. 


注意 , 上 下 界 之 间 存 在 着 巨大 的 差距 . 问题 在 于 当 n 一 co 时 , 集合 


用 . 我 们 的 目标 是 
为 n, 所 以 现在 从 


1o := {1,2,..…. ,n} 


会 变 得 非常 大 , 所 以 试图 找到 每 个 因子 的 上 下 界 是 非常 可 怕 的 . 


进 分 解 的 想法 是 


把 这 个 大 集合 分 解 成 较 小 的 集合 , 从 而 得 到 更 好 的 边界 , 然后 再 


这 些 结果 结合 在 


具体 地 说 , 把 这 个 集合 分 成 两 半 : 


So = {1,2,.… ,nn} = {1,2,.… ,nn/2} LU {n/2+1,n/2+2,.…, 


在 第 一 个 集合 中 , 每 一 项 都 至 少 为 1 且 至 多 为 n/2, 于 是 有 


1 人 /2 < 1.2..(n/2 -1)(n/2) < (n/2)™2. 


类 似 地 , 在 第 二 个 集合 中 , 每 一 项 都 至 少 为 n/2 十 1, 但 我 们 会 使 


n} :一 S1 U S2. 


用 nm/2 作为 下 界 ， 


因为 这 能 使 代数 表达 更 加 整洁 . 男 外 , 每 一 项 至 多 为 n. 于 是 我 们 有 


(n/2)™2 < /24 Dm/2+2) no ln < ne. 
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请 注意 , 我 们 仍 在 使 用 简单 的 思路 , 即 考 察 每 一 项 的 最 小 或 最 大 的 边界 . 这 基 
于 51 和 5。 的 大 小 都 是 初始 集合 5o 的 一 半 这 个 事实 . 因此 , 这 些 集合 的 变化 较 小 ， 
所 以 上 下 界 要 好 得 多 . 将 两 个 下 界 (或 上 界 ) 相 乘 , 我 们 就 得 到 了 ml 的 一 个 下 界 
(或 上 界 ): 

1°/2(n/2)™? < (12 (n/n/2 + Dn/2 42) < (2)72772， 


简化 可 得 


nr/2V2 < nl < nrvV2 ". 

注意 , 这 比 我 们 原来 的 平凡 边界 1 < n! < n" 要 好 得 多 : 上 界 与 斯 特 林 公式 非常 接 
近 (这 里 有 一 个 V2 “, 而 不 是 er”V27rm), 而 下 界 则 更 接近 . 

现在 , 我 们 采用 洗 头 的 流程 : 涂 泡 沫 、 冲洗、 重复 . 如 上 所 述 , 可 以 把 51 和 5。 
分 成 两 个 更 小 的 区 域 , 然后 进一步 分 解 这 些 新 的 区 域 (但 实际 操作 会 略 有 不 同 ). 我 
们 会 在 下 一 小 节 中 做 这 些 事情 . 本 小 节 的 目的 是 慢 慢 地 介绍 这 种 方法 , 并 描述 它 为 
什么 能 发 挥 很 好 的 作用 . 简 而 言 之 , 成 功 来 自 于 一 种 微妙 的 平衡 . 当 考 察 的 目标 非 
常 小 时 , 一 切 都 不 会 有 变化 , 也 不 存在 近似 一 一 数 都 保持 其 真实 值 ， 当 目标 太 大 时 ， 
变化 就 会 太 多 , 边界 也 会 过 于 平凡 . 我 们 需要 在 两 者 之 间 找 到 巧妙 的 平衡 . 
18.5.2 ”斯 特 林 公式 的 下 界 I 

基于 上 面 的 二 进 分 解 思想 , 我 们 继续 利用 初等 方法 来 考察 n!. 不 必 把 每 个 小 全 
合 都 对 半 划 分 , 而 是 只 需要 划分 前 一 个 集合 ( 即 包含 较 小 数 的 集合 ). 这 样 就 得 到 了 

一 系列 不 同 大 小 的 集合 , 并 且 每 个 集合 的 大 小 都 是 前 一 个 的 一 半 . 

具体 地 说 ， 我们 研究 包含 在 下 列 区 间 中 的 nl! 的 因子 : 五 = (n/2,n], 五 = 


(n/4,n/2), 13 二 (2/8,m/4a， 2 LN 二 (1, 2). 注意 ， 在 Tx 中 ， n/2* 个 因子 中 的 每 
个 都 至 少 为 n/2*. 于 是 
N 
=][ 1 ™ 
k=1 mEI 


> 开 人 人 ” 


到 nr/2tn/4tn/8t +n/2N 9—n/24—n/48—n/8 a (2V)-?/2 ， 


我 们 慢 慢 地 仔细 观察 上 面 的 每 个 因子 . 注意 , ”的 方 索 和 几乎 等 于 n. 如 果 考 
虑 到 n/2N = 1( 因 为 我 们 假设 n= 2*), 那么 结果 的 确 如 此 . 但 是 , 由 于 n= 2 , 所 
以 乘 以 (n/2X)"/2” 不 会 产生 任何 影响 , 原因 是 这 个 值 就 等 于 11( 乘 以 1 是 一 种 非常 
有 用 的 技巧 , 关于 它 的 更 多 应 用 , 请 参阅 A.12 节 ). 现在 , n! 大 于 

nm/2+n/4tn/8t.1 Fn/2™ tn/2™ 9 n/24—n/48 m8.. (2N) -nm/2™ (2)—n/2". 
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于 是 , 关于 n 的 项 就 等 于 n*. 2 的 方 曙 和 是 多 少 ? 它 就 是 


9—n/24-n/48—n/8... (2N)-—™/2™ 9—n/2™ i 9—n(1/2+2/4+3/8+"N/2N )o—2™ /2™ 


9—n(D ER Rk/2*)o—2™ /2 
> 9—n(DRok/2")o—1 


1 
一 2 一 27 一 | CE 
2 


为 了 看 出 这 一 点 , 我 们 使 用 下 面 这 个 巧妙 的 恒等式 : 


相关 证 明 请 参阅 11 


> kx* = 和 
ee 
er U0 


.1 节 (关于 几何 级 数 公 式 的 微分 恒等式 ). 


把 所 有 东西 组 合 在 一 起 , 我 们 发 现 


这 与 真实 值 n"e-" 


果 . 例如 , 考虑 区 间 


1 
nl 二 24 ", 


2 


非常 接近 . 它 肯 定 比 第 一 个 下 界 nn"/22-"/2 要 好 得 多 . 
就 像 生活 中 的 许多 事情 一 样 , 如 果 愿 意 多 做 点 工作 , 我 们 就 可 以 得 到 更 好 的 结 


五 = (n/2,n]. 我们 可 以 把 首尾 的 元 素 进行 配对 : n 和 m/2 十 1， 


n 一 1 和 nn/2 二 2,n 一 2 和 n/2 二 3, 一 直到 3n/4 和 3n/4 十 1. 例如 , 如 果 考 虑 区 间 
(8,16], 那么 上 面 这 些 数 对 分 别 是 : (16,9)、(15,10)、(14,11) 和 (13, 12). 现在 我 们 


考虑 微 积分 中 的 1 
当 z = = 工 /2 时 ， 


个 黄金 标准 问题 : 已 知 x 十 y = 五 如 果 想 求 zy 的 最 大 值 , 那么 


这 个 最 大 值 会 出 现 . 这 通常 被 称 为 农夫 鲍 勃 (或 布朗 ) 问题 , 它 


有 个 非常 有 趣 的 解释 . 我 们 正 试图 建造 一 个 面积 达到 最 大 的 矩形 围栏 , 目的 是 在 该 


区 域内 放牧 奶牛 . 己 知 矩形 围栏 的 周 长 是 L, 那么 正确 答案 就 是 将 其 建造 成 正方 形 . 
因此 , 在 所 有 可 能 的 选择 中 , 乘积 最 大 的 一 对 数 是 3n/4 和 3n/4 十 1, 乘积 最 小 的 则 
是 n 和 7m/2+1 并 |] 


日 后 者 的 乘积 要 大 于 m2/2. 于 是 , 把 五 中 每 一 对 乘积 都 奉 换 成 


Vn2/2 = mn/V2, 从 而 使 得 五 中 全 体 元 素 的 乘积 减 小 . 通过 简单 的 思考 , 不 难得 到 


和 


这 很 好 地 改进 了 (n/2)"2, 也 不 需要 做 太 多 额外 的 工作 ! 
现在 对 五 做 类 似 的 分 析 . 乘积 最 小 的 一 对 数 是 n/2 和 n/4 二 1, 它们 的 乘积 会 


大 于 "2/8. 像 之 前 那样 论述 , 我 们 有 
n/4 be n/4 nv3 n/4 
"> ( 庆 -( 泊 ) -~ (学) 


TaET2 
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到 目前 为 止 , 规律 应 该 很 清晰 了 . 我 们 得 到 的 结果 几乎 和 以 前 一 样 , 唯一 的 区 
别 是 , 在 分 子 中 每 次 都 会 有 一 个 nV2 而 不 是 n, 这 使 得 代数 表达 式 有 了 一 些小 变 
化 , 我 们 看 到 


1 nA4—n 1 n —n 
nl 之 3(nV2) 和 (2V2)™™. 


注意 , 这 个 结果 与 nme-" 非常 接近 , 这 是 因为 2V2 = 2.828 43, 它 比 e 2 2.718 28 略 
大 一 些 . 令 人 惊讶 的 是 , 我 们 的 分 析 使 得 结果 与 斯 特 林 公式 非常 接近 . 很 快 就 会 得 
到 斯 特 林 公式 了 ! 

本 节 完 成 了 对 基本 问题 的 论述 , 建议 你 试 着 去 解决 几 件 事 . 

。 你 可 以 修改 上 面 的 论述 从 而 得 到 nl 的 一 个 不 错 的 上 界 吗 ? 


。 读 完 上 面 的 论述 , 你 应 该 想 知道 究竟 可 以 把 问题 推广 到 什么 程度 . 如 果 不 考虑 

二 进 分 解 , 问题 该 如 何 解决 ?如 果 做 三 进 分 解 呢 : (2n/3,n], (4n/9,2n/3],…? 

2 的 方 守 或 许 是 个 不 错 的 条 件 , 所 以 我 们 可 能 不 该 做 三 进 分 解 , 而 是 做 四 进 

分 解 ? 又 或 者 固定 一 个 +, 并 对 某 个 通用 常数 7 考察 (rn,n], (7r2n,rn],…. 

利用 这 一 点 和 上 述 配 对 方法 , 能 得 到 的 最 大 下 界 是 多 少 ? 换 句 话说 , 当 7 取 

何 值 时 , 乘积 的 下 界 取 到 最 大 值 ? 

本 节 的 证 明 几乎 全 都 是 初等 内 容 . 有 一 步 使 用 了 微 积 分 : 我 们 需要 知道 之 。 

kz* 等 于 z/(1 一 7X)?. 幸运 的 是 , 不 用 微 积分 就 能 证 明 这 个 结果 , 只 需要 利用 1.2 节 
篮球 竞赛 中 的 无 记忆 过 程 . 我 将 在 习题 18.8.19 中 概述 这 个 论点 . 

18.5.3 ”斯 特 林 公式 的 下 界 II 

我 们 将 继续 考察 这 些 初等 方法 , 看 看 它们 能 推广 到 什么 程度 . 当然 , 从 某 种 意 

义 上 说 , 没有 必要 这 样 做 , 有 一 些 更 强大 的 方法 可 以 用 较 少 的 工作 量 产生 更 好 的 结 

果 . 事实 的 确 如 此 , 所 以 现在 自然 有 了 一 个 令 人 困扰 的 问题 ; 为 什么 要 花 时 间 这 样 

做 ? 


给 出 这 些 论述 的 原因 有 几 种 . 首先 , 虽然 这 些 论述 比 我 们 能 证 明 的 弱 一 些 , 但 
它们 需要 的 工具 更 少 . 为 了 证 明 斯 特 林 公式 , 或 者 证 明 它 有 很 好 的 边界 , 我 们 要 用 
到 微 积分 、 实 分 析 和 复 分 析 中 的 结果 . 弄 清楚 只 利用 整数 的 基本 性 质 可 以 做 些 什 么 
是 很 不 错 的 . 其 次 , 对 于 很 多 问题 , 我 们 只 需要 了 解 一 些 简单 的 限制 条 件 . 通过 仔细 
阅读 这 些 内 容 , 你 会 明白 该 如 何 生 成 这 样 的 初等 限制 , 希望 这 能 在 以 后 的 生活 中 对 
尔 有 所 玫 助 . 

在 此 重申 , 本 节余 下 的 部 分 是 高 等 知识 , 不 会 在 本 书 剩余 部 分 中 用 到 . 你 可 以 
放心 地 跳 过 , 但 建议 你 至 少 浏览 一 下 这 些 论 述 . 
现在 把 论述 做 进一步 推广 , 把 n= 2N 时 的 nl > ("/4)7” 推广 到 任意 整数 n 上 . 
换 名 话说 , 把 n 设 成 特殊 形式 n = 2N 是 可 行 的 . 不 妨 设 2 < n < 2*+1. 那么 , 存 
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在 茶 个 正 数 mm < 2*, 使 得 n 可 以 写成 n=2* 二 m. 利用 前 面 的 结论 可 得 


nl = n(n 1 (2 141) (2 人 > (2%)™m. (2%)! > (2%)™. (2*/4)>. 


接 下 来 的 目标 是 证 明 上 面 的 量 大 于 (mn/4)”. 这 里 有 一 种 可 行 的 方法 : 


2km . (28/4) = (n/4)®. 


如 果 a > mw 那么 我 们 就 得 到 了 结论 . 把 上 式 取 对 数 后 , 有 


km.:log2+2*.log(2)(k—2) = al(llog(n) — 2log2). 


从 中 解 出 a, 可 得 
Km log2 十 25.log(2)( 一 2) 

加 log(n) 一 2log2 

记 住 , 我 们 要 证 明 a > n. 如 果 把 前 面 的 表达 式 n= 关 十 mm 代入 , 那么 问题 就 变 成 

了 证 明 


k:m.:log2+2*.log(2)(k — 2) 
log(2* + m)— 2log2 
只 要 2* 十 m 大 于 4, 分 母 就 是 正 的 , 那么 就 可 以 在 不 改变 不 等 式 符 号 的 情况 下 做 乘 
法 : 


> 2*+m. 


log(2)(K(2* +m) 一 24+1) > (2 + m)log(2* + m)— log(2)2*+! — 2mlog?. 


做 一 些 简 单 的 代数 运算 , 可 以 把 它 变 成 一 个 更 好 的 表达 式 : 


log(2*)(2* + m) > (2* + m)(log(2* + m) — 2m log2) 


Wa 


2mlog2 > (2* + m)log(l + m/2”) 
2log2 > (1 +2*/m)log(l + m/2*). 


邻 t=m/2t. 那么 ,证 明 a >n 就 等 价 于 证 明 , 当 te (0,1) 时 有 


2log2 > (1+1/t)log(l+). 


为 什么 是 (0,1)? 由 0 < m <2* 可 知 , 0 < m/2* < 1, 所 以 +t 始终 介 于 0 和 1 之 
间 . 虽然 我 们 只 关心 + 具有 m/2* 形式 时 的 结论 , 但 如 果 可 以 证 明 te (0,1) 时 结论 
成 立 , 那么 当 t 取 特 殊 值 时 , 结论 自然 也 成 立 . 设 f(t) = (1 十 1/t)log(1 十 四 , 那么 
六 (#) = (tt 一 log(1 十 )/， 当 t >0 时, 了 17(t) 始终 为 正 (补充 一 个 有 趣 的 练习 : 当 
t 一 0 时 ,证 明 f(t) 的 极限 是 1/2). 因为 f(1) = 21og2, 所 以 f(t) < 2log2 对 所 有 
的 te (0,1) 均 成 立 . 于 是 , a > mw 所 以 对 于 任意 的 整数 n, 均 有 nl! > (n/4)". 
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18.5.4 ”斯 特 林 公式 的 下 界 III 

你 同样 可 以 放心 地 跳 过 ， 本 节 这 是 我 们 最 后 一 次 讨论 能 将 初等 论述 推广 到 什 
么 程度 . 学 习 这 部 分 内 容 可 以 很 好 地 了 解 该 如 何 展开 这 些 论 述 . 如 果 继 续 学 习 概 率 
论 和 数学 , 那么 你 很 有 可 能 会 在 将 来 的 某 段 时 间 里 沿 着 这 种 思路 进行 论证 . 

我 们 已 经 给 出 了 几 种 方法 来 证 明 nl > (n/4)” 对 所 有 整数 n 均 成 立 . 但 是 , 斯 
特 林 公式 告诉 我 们 n! > (n/e)”. 为 什么 我 们 一 直 在 处 理 4? e 会 在 哪里 出 现 呢 ? 下 
面 的 简 述 并 不 能 证 明 n! > (mn/e)", 却 暗 示 我 们 e 可 能 会 出 现在 方程 中 . 

在 之 前 的 论述 中 ,我 们 给 出 了 并 把 数 轴 划分 成 以 下 区 间 : {[Imm/2), [7/2， 
n/4),…}， 这 种 做 法 的 问题 是 [n,n/2) 是 个 很 大 的 区 间 , 在 用 (nz/2)"/2 近似 n. 
(n 一 1)… 2 的 过 程 中 会 丢失 大 量 信 息 . 如 果 能 用 较 小 的 区 间 就 更 好 了 . 因此 , 考虑 
使 用 某 个 比值 7 < 1, 并 设 n= (1/7)*. 我 们 想 把 数 轴 划 分 成 {Im rm [rn,72n),…】》， 
但 现在 的 问题 是 当 1 < 时 ,rin 不 总 是 整数 . 暂时 搁置 这 个 问题 (这 就 是 它 不 是 证 
明 的 原因 ! ), 我 们 按照 通常 的 做 法 继续 进行 下 去 : 对 数 轴 进 行 划 分 , n! 会 大 于 各 区 
间 内 最 小 数字 的 方 容 的 乘积 , 而 这 个 方 寡 就 是 该 区 间 内 整数 的 个 数 ; 


nl > (rn) tn(r2n)™ ln 5 (r3n)™ (mm 本 (r* . mr nn, 


因为 m > 1 时 r*+mn <1, 所 以 上 述 乘 积 可 以 推广 到 无 穷 多 个 : 
nl > (rm) nn) nn . (r3n)”™ Qn)n es (7 . nn) nn Rh 


虽然 这 会 让 值 变 小 , 但 并 没有 太 大 影响 . 原因 就 在 于 lims_,o zx” = 1. 我 们 把 上 式 简 
化 一 下 . 看 一 看 与 n 有 关 的 项 , 因为 和 是 徐 套 的 , 所 以 


oR] 
让 Fj nn. 


看 一 下 与 > 相关 的 项 , 有 


rn(1—7)(1+2r+3r + ) 


Pa(1I 一 rr(r 十 2r2 十 3r + 


2 rn) /rr/ (Lr)? 


= TAU 下)， 
其 中 , 第 三 步 利 用 了 恒等式 
kr* = 
2 ”三 


回忆 一 下 , 我 们 早 些 时 候 也 使 用 过 这 个 恒等式 ! 把 上 面 两 项 结合 起 来 , 则 有 


nl > (rUU-Dm)n， 
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为 了 使 不 等 式 尽 可 能 强 , 我 们 想 找到 当 re (0,1) 时 7Y4-7 的 最 大 值 . 令 x = 
1/(1 一 7), 这 个 问题 就 变 成 了 : 当 z 一 co 时 , (1 一 1/z)” 的 极限 是 多 少 ? 你 之 前 
应 该 遇 到 过 这 个 极限 , 第 一 次 见 到 它 往 往 是 在 连续 复 利 中 ， 它 就 是 e-!( 参 见 B.3 


情形 ). 


18.6 


任何 与 斯 特 林 公式 一 
克 韦 斯 坦 因 的 “斯 特 林 近 
为 了 证 明 这 个 定理 , 我 人 


节 )，ez 有 两 个 定义 , 一 个 用 级 数 定义 , 男 一 个 用 极限 来 定义 . 于 是 ,这 个 论述 给 
出 了 关于 ml > (mn/e)” 的 启 


发 式 证 明 ( 记 住 , 我 们 只 考虑 n 是 7 的 某 次 方 的 特殊 


静态 相位 与 斯 特 林 公 式 


重要 的 结果 都 值得 多 次 证 明 .， 下 面 的 证 明 是 对 埃 里 


以 
] 


n! = TIT(n+1) = 


参阅 [We]) 的 修改 
使 


用 恒等式 


e “xz" dzx. (18.2) 
0 


对 伽 马 函数 的 回顾 , 包括 它 推广 了 阶乘 函数 的 证 明 , 都 可 以 在 第 15 草 中 找到 . 我 们 
这 样 做 的 原因 是 , 用 连续 函数 的 积分 来 代替 整数 阶乘 的 离散 序列 . 这 样 就 可 以 使 用 
更 多 工具 , 而 且 可 以 给 出 一 些 重 要 的 结果 . 


为 了 得 到 


一 个 近似 , 我 们 想 知道 被 积 


函数 什么 时 候 取 到 最 大 值 . 因为 被 积 E 


数 中 存在 指数 因子 , 所 以 在 求 导 之 前 先 取 对 数 .， 之 所 以 这 样 做 , 是 因为 求 正 函数 
f(z) 的 最 大 值 就 等 价 于 最 大 化 log f(z). 


这 个 原理 存在 很 多 有 用 的 版 本 : 在 微 积 


分 中 , 求 距离 平方 的 最 小 值 通常 比 最 小 化 距离 更 容易 (因为 这 样 就 避免 了 平方 根 


函数 )， 
我 们 有 


二 log(e 


于 是 , 被 积 函 数 的 最 大 值 只 


Dn 


d n 
三 37 T+ nlogz) 三 了 一 上 


d 


的 速度 快 很 多 , 我 们 假设 对 积分 起 重要 作 月 
小 很 多 . 我 们 不 再 进一步 讨论 这 个 假设 , 天 


在 z =n 时 出 现 . 由 于 指数 因子 减少 的 速度 比 z" 增长 


的 唯一 因素 是 z =n 十 a, 其 中 |al 比 n 


为 这 里 的 目的 是 给 出 另 一 个 支持 斯 特 林 


公式 的 论述 , 而 不 是 提供 证 明 的 所 有 详尽 细节 ， 当然, 我 鼓励 你 去 探索 共有 其 他 形 


式 的 z 能 够 发 挥 什么 作用 , 并 使 这 个 分 析 更 加 严谨 . 于 是 


logx = log(n+a) = logn + log (1 十 ~) 
现在 用 log(1 + ) 的 泰勒 级 数 展开 第 二 项 , 即 
a 1o? 
log(n+a) = logn+——57 + 
mW 2 


因此 
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1 2 
log(z"e ”)=nlogz—7z Nn 16 攻 交 下 人 二 二 全， 一 (7 十 ay) 
2 
lo 
二 nn J 
S 2n2 


由 此 可 得 


22 2 
rz"e” NT exp|1mnlog7 一 7 一 一 -| = me .exp| 一 一 一 |， 


其 中 a 小 于 n. 回 到 式 (18.2) 关于 nl 的 积分 表达 式 , 我 们 有 


最 后 一 步 利 用 了 当 a < 一 n 时 , 被 积 函数 非常 小 这 一 事实 . 这 个 积分 
方差 为 Vn 的 正 态 分 布 的 概率 密度 函数 的 积分 是 一 样 的 ， 它 的 值 就 是 Va 于 是 
有 
nl 3 ne "V2mn, 
这 就 是 定理 的 内 容 . 


这 个 证 明 体现 了 一 种 非常 强大 的 方法 , 即 静 态 相 位 法 (例子 参见 [SS 
很 好 的 工具 , 通过 寻找 最 重要 的 部 分 来 近似 高 度 振荡 的 积分 . 请 注意 


献 来 自 于 最 大 值 附近 的 z. 我 非常 喜欢 因子 V2r 出 现在 证 明 中 的 方式 


2]). 这 是 个 
最 重要 的 页 
它 是 标准 


正 态 分 布 的 标准 化 常数 . 首位 呼应 , 还 记得 我 们 曾 说 过 这 与 T(1/2) = VE 有 关 吗 ? 


18.7 “中心 极 限定 理 与 斯 特 林 公式 


本 章 最 后 再 给 出 一 个 斯 特 林 公 式 的 证 明 . 我 们 会 延续 需要 越 来 越 多 输入 的 趋 
势 . 第 一 个 证 明 非 常 简单 , 基本 上 只 用 到 了 积分 判别 法 . 第 二 个 证 明 更 复杂 些 , 需 
要 利用 伽 马 函 数 . 最 后 一 种 方法 则 涉及 中 心 极限 定理 的 应 用 , 而 中 心 极限 定理 是 概 
率 中 最 重要 的 结论 之 一 . 我 们 会 在 第 20 章 给 出 中 心 极限 定理 的 证 明 . 如 果 还 没 见 


过 这 个 证 明 , 可 以 去 看 一 看 , 也 可 以 选择 先 接受 这 个 结果 , 稍 后 再 去 研读 相关 内 容 . 


服从 泊 松 分 布 的 随机 变量 之 和 也 会 服从 泊 松 分 布 (参阅 19.1 节 的 证 明 


证 明 的 思路 是 , 对 相互 独立 且 同 分 布 于 参数 为 1 的 泊 松 分 布 的 随机 变量 之 和 
应 用 中 心 极限 定理 . 我 们 有 一 个 明确 的 概率 公式 , 因为 在 经 过 适当 的 标准 化 之 后 ， 


). 另外, 利 
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用 中 心 极限 定理 , 我 们 还 可 以 知道 这 个 概率 是 多 少 (或 者 至 少 知道 概率 的 近似 值 是 
多 少 ). 把 二 者 等 同 起 来 就 得 到 了 斯 特 林 公式 . 

回顾 以 下 内 容 . 

(1) XX 服从 参数 为 和 的 泊 松 分 布 意味 着 


Me 车 m> 0 是 整数 
Prob(X = m) = | nl 中 
0 其 他 . 


(2) 如 果 Xi1,… ,XN 是 独立 同 分 布 的 随机 变量 , 它们 的 均值 都 是 , 方差 都 是 
02, 等 等 (比如 , 三 阶 矩 是 有 限 的 或 矩 母 函 数 存在 ), 那么 Xi 十 … 十 XN 收 
敛 于 均值 为 ww 且 方 差 为 na2 的 正 态 分 布 . 
现在 给 出 具体 细节 . 关于 泊 松 分 布 的 一 个 重要 且 有 用 的 事实 是 , 对 于 n 个 相 
互 独立 且 均 服从 参数 为 和 的 泊 松 分 布 的 随机 变量 , 它们 的 和 会 服从 参数 为 nA 的 
泊 松 分 布 . 如 果 随 机 变量 Y 服从 参数 为 和 的 泊 松 分 布 , 那么 它 的 质量 函数 就 是 : 
当 m 为 非 负 整 数 时 , Prob(Y = m) = 和 Ye-^/ml, 否则 Prob(Y = m) = 0， 因 此， 
Xi 十 … 十 Xn 的 概率 密度 函数 是 
n™e /mal 若 m 是 非 负 整数 
ee | 其 他 


当 mn 较 大 时 , 由 中 心 极限 定理 可 知 , Xi 十 … 十 Xn( 除 了 服从 参数 为 n 的 泊 松 
分 布 外 ) 会 近似 于 均值 为 n.1 且 方 差 为 n 的 正 态 分 布 (对 于 服从 参数 为 和 的 泊 松 
分 布 的 随机 变量 , 其 均值 和 方差 都 等 于 和 ). 由 于 Xi 十 … 十 X 的 取 值 具有 离散 型 ， 
我 们 一 定 要 谨慎 些 . 但 是 , 简单 地 检查 一 下 就 会 发 现 , 中 心 极限 定理 允许 我 们 用 下 
面 的 式 子 来 近似 nn 一 示 < Ii 十 … 十 Xn 二 nn 十 的 概率 ， 


MD 


， ex ( ( n)? /2n) dz = 志 i a 

n-$ V2mn 于 2 27n ./ 一 172 
当 很 大 时 , e-2/2r 会 近似 于 上 = 0 时 的 泰勒 级 数 展开 式 的 0 次 项 , 也 就 是 1. ] 
是 


1 1 1 
Prob (n—3 < Xt t Xn <nt3) 3 Ce.1.:1, 
2 2 27n 


其 中 , 第 二 个 1 表示 这 个 区 间 的 长 度 . 但 是 , 我 们 可 以 很 轻松 地 求 出 左 端 表达 式 的 
值 , 因为 这 就 是 服从 参数 为 的 泊 松 分 布 的 随机 变量 Xi 十 … 十 X 等 于 n 时 的 概 
率 , 也 就 是 nm*e-"/nl. 于 是 


ne ™ 1 
i 祥 一 全 11S ne V2T7. 
nl 27n 
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这 种 方法 最 常见 的 错误 之 一 是 忘记 泊 松 分 布 是 离散 的 ， 而 标准 正 态 分 布 是 连 
续 的 . 因此 , 为 了 得 到 泊 松 分 布 在 ”处 质量 的 近似 值 , 我 们 应 该 求 标准 正 态 分 布 
的 连续 的 概率 密度 函数 在 n 一 1/2 到 n+1/2 上 的 积分 . 就 这 个 问题 而 言 , 存在 一 
个 偶然 的 幸运 情况 : 即便 忘记 求 积分 , 我 们 也 会 得 到 相同 的 答案 . 

应 该 注意 到 , 上 面 的 论述 并 不 完全 是 斯 特 林 公 式 的 独立 证 明 . 关键 是 当 使 用 中 
心 极限 定理 时 , 要 对 误差 项 有 一 定 的 控制 . 也 就 是 说 , 上 面 的 论述 应 该 非常 有 说 服 
力 . 另外 , 非常 有 趣 的 是 , 这 是 我 们 对 “因子 V2 来 自 于 正 态 分 布 积分 ”的 第 二 次 
证 明 . 


18.8 习 题 


习题 18.8.1 ”对 于 较 大 的 n, 斯 特 林 公式 会 高 估 nl!, 还 是 会 低估 n1? 对 你 的 答案 做 数值 检验 . 

习题 18.8.2 ”对 于 较 大 的 n, 找到 log(n!) 的 公式 . 

习题 18.8.3 ” 求 200! 的 近似 值 . 误差 百分比 是 多 少 ? 

习题 18.8.4 ”你 必须 考察 多 少 误差 项 才能 使 得 近似 200! 的 误差 低 于 百 万 分 之 一 ? 

习题 18.8.5 。” 求 (599) 的 近似 值 , 其 中 所 有 阶乘 项 都 用 斯 特 林 公式 来 近似 .这 个 估算 会 出 
什么 问题 ? 当 n 较 大 但 或 n 一 k 较 小 时 , 有 什么 更 好 的 方法 来 近似 (7)? 

习题 18.8.6 ”想象 一 下 , 学 校 食堂 里 有 200 个 人 . 食堂 里 有 20 张 圆 形 餐 桌 , 并 且 每 张 桌子 都 
可 以 坐 10 个 孩子 . 已 知 每 张 桌子 都 是 不 同 的 , 并 且 需 要 考虑 任意 两 人 坐 在 桌 旁 的 相对 次 
序 , 请 问 共 有 多 少 种 不 同 的 座位 安排 ? 

习题 18.8.7 ”重复 上 一 道 习题 , 但 现在 假设 桌子 是 不 可 区 分 的 . 

习题 18.8.8 ”现在 假设 把 桌子 摆 成 了 一 个 巨大 的 圆圈 桌子 之 间 没 有 明显 的 区 别 , 唯一 不 同 
的 是 桌子 之 间 的 相对 次 序 , 这 是 因为 孩子 们 并 不 介意 跨越 桌子 与 旁边 的 朋友 嬉闹 . 求 出 大 

约 有 多 少 种 不 同 的 座位 安排 . 


习题 18.8.9 ”利用 二 进 分 解 来 求 出 n! 的 一 个 上 界 . 

习题 18.8.10 ” 求 出 利用 分 解法 可 以 找到 的 最 小 上 界 . 

习题 18.8.11 证明: limn_wo nl/”=1. 

习题 18.8.12 ”证 明 : lim_w 全 对 所 有 的 z 发 散 . 

习题 18.8.13 ”计算 lim ,oo D2_, (918(%). 

习题 18.8.14 。 求 出 lim_,wo "_j log(k) 汪 的 一 个 近似 值 . 

习题 18.8.15 ”反正 弦 函 数 的 泰勒 级 数 公式 为 sn 1(z) = 部 > 6 名 2* 1 利用 其 


特 林 公式 , 求 出 这 个 级 数 的 收敛 半径 . 

习题 18.8.16 ” 当 n 较 大 时 , 求 出 nl! 的 一 个 不 错 的 上 界 和 下 界 . n 取 偶 数 或 奇数 对 答案 有 
影响 吗 ? 

习题 18.8.17 ”算术 -何平 均值 ( AM-GM) 是 数学 中 最 有 用 的 不 等 式 之 一 .证 明 : 如 果 zl, za > 
0, 那么 畔 过 > Vziza. 更 一 般 地 , 证 明 : 于 > VT. 

习题 18.8.18 ” 求 出 如 logt 和 tlog2t 的 原 函 数 . 
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习题 18.8.19 ”对 于 ?0 kz* 二 wz/(1 一 2z)?, 请 把 其 基本 证 明 的 细节 补充 完整 . 
(1) 设 S(z) = ?okz*. 显然 有 S(z) = 二 并 2 pz 人 1 一 z). 如 果 一 枚 硬币 掷 出 反 
面 的 概率 是 z, 掷 出 正面 的 概率 是 1- z, 那么 首次 掷 出 正面 发 生 在 第 (k 十 1) 次 抛掷 
的 概率 为 z*(1 一 xz). 这 几乎 是 首次 掷 出 正面 需要 等 待 时 间 的 期 望 值 . 在 上 面 的 表达 
式 中 , 外 侧 除 以 1 一 z 很 容易 理解 , 但 和 式 中 出 现 的 是 因子 , 而 不 是 天 十 1. 对 于 这 
一 点 , 把 改写 成 (k 十 1) 一 1 然后 证 明 : S(x) = 下- Dok 十 1x*(1 一 7x) 一 二 ;. 
(2) 已 知 一 枚 硬币 掷 出 正面 的 概率 是 1 - zx. 设 随机 变量 W 表示 这 枚 硬币 首次 掷 出 正 
面 时 抛 丘 的 总 次 数 . 如 果 jw 是 W 的 期 望 值 , 那么 S(z) = 乌 - 于. 
(3) 证 明 : pw = (1 一 7x) 十 x(jw 十 1). (提示 : 如 果 第 一 次 掷 出 了 正面 , 那么 就 完成 了 . 
如 果 第 一 次 掷 出 了 反面 , 那么 像 又 重新 开始 了 , 但 此 时 多 出 了 一 个 额外 的 反面 ). 做 
一 些 简单 的 代数 运算 就 可 以 得 到 Hp = 二. 
(4) 把 pw 代入 S(z) 的 表达 式 , 并 推导 出 S(z) = 入 yz 
习题 18.8.20 ”证 明 : lim。,o+ z2 = 1 
习题 18.8.21 ”绘制 阶乘 函数 与 斯 特 林 逼 近 之 闻 的 差 . 
习题 18.8.22 ”绘制 伽 马 函数 (移动 1 位 ) 与 斯 特 林 通 近 之 间 的 差 . 
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数学 中 有 种 常见 的 抱怨 : 如 果 逐 行 地 看 , 我 可 以 理解 整个 证 明 , 但 谁 又 能 想到 
要 这 样 做 呢 ! 在 概率 论 的 所 有 领域 中 , 生成 函数 是 最 容易 出 现 这 种 抱怨 的 地 方 . 乍 
一 看 , 这 似乎 让 我 们 的 生活 变 得 不 必要 地 复杂 . 但 是 , 在 本 章 的 最 后 , 你 会 看 到 生成 
函数 可 以 解决 很 多 种 的 问题 . 此 外 , 当 你 继续 学 习 时 , 花 在 这 些 技巧 上 的 时 间 会 不 
断 带 来 回报 , 因为 这 些 技巧 不 仅 适 用 于 概率 论 , 还 贯穿 于 整个 数学 物理 学 . 

这 些 技巧 有 这 人 么 大 帮助 的 原因 是 , 我 们 可 以 把 问题 的 大 量 相关 信息 进行 汇总 . 
你 可 能 会 怀疑 这 样 做 是 否 值得 , 但 我 们 会 不 断 看 到 , 这 种 新 观点 简化 了 需要 做 的 代 
数 运算 . 我 们 会 从 之 前 的 课程 中 提取 出 一 些 基 有 启发 性 的 例子 , 并 说 明 改变 观点 是 
如 何 帮 你 节省 时 间 的 , 然后 再 描述 生成 函数 的 一 些 性 质 和 应 用 . 虽然 很 多 问题 都 难 
以 找到 可 以 正确 使 用 的 生成 函数 , 但 大 量 有 用 的 问题 都 可 以 用 一 些小 技巧 来 处 理 . 
因此 , 耐心 地 阅读 吧 一 一 你 花 在 掌握 这 些 材料 上 的 时 间 会 对 未 来 有 所 帮助 . 
在 概率 论 中 , 生成 函数 最 重要 的 用 途 是 理解 随机 变量 的 矩 . 正如 我 们 所 知道 的 ， 
可 以 通过 这 些 矩 来 了 解 分 布 的 形状 . 生成 函数 的 一 个 非常 强大 的 应 用 就 是 证 明 中 心 
极限 定理 . 中 心 极限 定理 告诉 我 们 , 在 很 多 情况 下 , 对 于 相互 独立 的 随机 变量 而 言 ， 
随 着 变量 个 数 的 不 断 增加 , 变量 和 会 趋向 于 一 个 高 斯 分 布 . 我 们 将 用 第 20 章 来 讨 
论 这 个 定理 (这 应 该 是 意料 之 中 的 事 , 任何 与 “中心” 有关 的 结论 都 应 该 在 这 门 课 
中 发 挥 重要 的 作用 ). 


19.1 动 机 


在 数学 中 , 我 们 经 常 遇 到 复杂 的 数据 集 , 然后 对 它 做 运算 , 使 它 变 得 更 加 复杂 ! 
例如 , 假设 第 一 个 数据 集 是 随机 变量 Xi 取 给 定 值 的 概率 , 第 二 个 数据 集 是 随机 变 
量 Xs 取 给 定 值 的 概率 . 利用 这 些 信息 , 我 们 可 以 通过 亦 力 计算 来 确定 Xi + X2 取 
某 个 值 的 概率 , 但 是 仍 希望 可 以 尽量 避免 这 些 烦琐 的 计算 . 接 下 来 , 我 们 将 详细 地 
研究 这 个 问题 的 特殊 情形 , 即 两 个 随机 变量 均 服 从 泊 松 分 布 (关于 泊 松 分 布 的 相关 
性 质 , 请 参阅 12.6 节 ). 我 们 可 以 彻底 解决 这 种 情形 下 的 问题 , 但 解决 方案 并 不 令 人 
满意 . 问题 是 , 对 于 如 何 处 理 代 数 运算 , 我 们 需要 一 些 有 预见 性 的 灵感 . 这 个 例子 
的 目的 是 为 了 做 好 准备 : 我 们 将 引入 生成 函数 来 自动 处 理 代数 运算 . 

不 妨 设 Xi 服从 参数 为 5 的 泊 松 分 布 , X。 服从 参数 为 7 的 泊 松 分 布 . 这 意 


味 着 
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Prob(Xi1 = m) = 5"e /ml 
Prob(X2 = n) = 7"e " /nl, 


其 中 , m 和 了 均 取 遍 所 有 的 非 负 整数 . 如 果 是 非 负 整数 , 那么 通过 考察 两 个 非 负 
整数 之 和 为 的 所 有 可 能 情况 , 我 们 能 求 出 Xi + X2 = 的 概率 . 显然 ,Xi 的 取 值 
一 定 介 于 0 和 天 之 间 . 如 果 Xi = 那么 X2 一 定 等 于 一 1. 由 于 这 两 个 随机 变量 


ee 发 生 这 种 情况 的 概率 就 是 Xi = ! 的 概率 与 Xa = 一 1 的 概率 的 乘 


只 . 如 果 对 1 求 和 , 就 得 到 了 Xi + X2 等 于 的 概率 : 


Prob(Xi 十 > Prob(X 


DProb(X2 = 大 一 小 


对 于 一 般 的 随机 变量 之 和 , 我 们 很 难 用 一 种 更 具 启 发 性 的 方式 来 写 . 但 是 , 如 果 碰 
巧 想到 了 下 面 的 简化 过 程 , 就 能 很 幸运 地 得 到 服从 泊 松 分 布 的 随机 变量 之 和 ! 

(1) 首先 注意 到 , 我 们 有 因子 1 一 0 这 几乎 等 于 ( 镶 , 也 就 是 EN 一 人) 

我 们 要 使 用 数学 中 最 有 用 的 技巧 之 一 , 即 巧妙 地 乘 以 1( 更 多 例子 , 请 参阅 

A.12 节 ), 我 们 把 1 写成 局/ 局 那么 上 述 因子 就 变 成 了 (*)/k!， 由 于 这 里 


对 71 求 和 , 所 以 1/k! 可 提 到 和 了 式 外 面 . 


(2) 和 式 中 的 e-5 和 e-” 与 1 无 关 , 因此 也 可 以 提取 出 来 , 这 样 就 得 到 了 e-12. 


(3) 现在 得 到 了 所 疡 4 (*)517*-!. 回忆 
发 现 1 的 和 式 就 等 于 (5 十 7)*, 即 12*. 
综 上 所 述 , 可 得 


Prob(X1 + X2 =k) = 


注意 , 这 是 参数 为 12(12 = 5 十 7) 的 泊 松 分 布 的 概率 密度 函数 .在 上 面 的 论述 中 ， 


5 和 7 没有 任何 特别 之 处 . 对 于 更 一 般 的 情形 , 如 


下 二 项 式 定 理 


定理 A.2.7), 我 们 


Se 


125e 一 12 


k! 


果 两 个 随机 变量 分 别 服 从 参数 为 


Al 和 》Xa 的 泊 松 分 布 , 那么 它们 的 和 将 服从 参数 为 Xi + 和 2 的 泊 松 分 布 . 
这 个 论述 可 以 做 进一步 推广 . 由 归纳 法 (或 者 通过 巧妙 地 分 组 ) 可 知 


泊 松 分 布 . 


服从 泊 松 分 布 的 随机 变量 之 和 : 已 知 ww 个 相互 独立 的 随机 变量 .如 果 它 们 分 别 
服从 参数 为 X…… ,和 的 泊 松 分 布 , 那么 它们 的 和 就 服从 参数 为 十 … 十 和 x 的 


非常 幸运 , 我 们 找到 了 一 种 “自然 ”的 方法 来 处 理 这 种 情形 下 的 代数 运算 , 从 
而 能 够 看 出 答案 . 如 果 考 察 其 他 随机 变量 之 和 , 情况 又 是 什么 样 的 呢 ? 我 们 希望 得 
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到 一 个 通用 的 方法 , 而 不 需要 看 出 这 些 聪明 的 代数 技巧 . 

幸运 的 是 , 有 这 样 的 方法 , 它 就 是 生成 函数 理论 . 我 们 首先 描述 生成 函数 是 什 
么 ( 它 有 几 种 形式 . 根据 你 研究 内 容 的 不 同 , 有 些 形式 会 比 其 他 形式 更 有 用 ), 然后 
展示 一 些 相关 应 用 . 


19.2 定 义 


现在 定义 序列 的 生成 函数 .尽管 最 常见 的 应 用 通常 出 现在 序列 中 的 项 是 不 同 
事件 的 概率 或 者 分 布 的 矩 时 , 但 任何 序列 都 可 以 定义 生成 函数 . 本 节 将 定义 生成 函 
数 并 通过 一 个 例子 来 说 明 其 用 途 . 稍 后 , 我 们 将 通过 以 下 两 种 方式 把 所 学 知识 应 用 
到 概率 上 : (1) 将 下 面 的 on 看 作 一 个 只 取 非 负 整 数值 的 离散 型 随机 变量 等 于 n 的 
概率 ; (2) 把 on 看 作 随机 变量 的 矩 . 


定义 19.2.1 (生成 函数 ) 已 知 序列 {anjse 0 它 的 生成 函数 被 定义 为 


Gals) = Sa 
n=0 


其 中 , s 是 使 这 个 和 收敛 的 任意 数 . 


标准 惯例 是 使 用 字母 。 作为 变量 , 然而 它 只 是 个 虚拟 变量 , 我 们 可 以 使 用 任何 
字母 : s、z, 甚至 是 人 只 要 看 看 这 个 定义 , 我 们 就 没有 理由 相信 在 研究 任何 事情 
方面 已 经 取得 了 任何 进展 . 我 们 想 弄 清楚 序列 {anj}% 0 一 一 利用 它 如 何 得 到 一 个 无 
穷 级 数 ! 我 们 通常 会 得 到 G(s) 的 一 个 简单 的 解析 表达 式 , 并 且 可 以 从 这 个 简单 的 
表达 式 中 轻松 地 推导 出 on 的 很 多 性 质 . 

现在 来 看 一 个 例子 , 虽然 它 很 长 , 却 值得 一 提 , 因为 它 强 调 了 生成 函数 的 许多 
要 点 以 及 它们 为 什么 如 此 有 用 . 差不多 每 个 人 都 见 过 斐 波 那 契 数 , 其 定义 为 而 = 0， 
站 = 1 一 般 形式 为 到 = 太 -1 二 及 -2 它 的 前 几 项 是 0,1,1,2,3,5,8,13,…. 这 些 
数 有 很 多 奇妙 的 性 质 . 在 大 自然 中 , 它们 无 处 不 在 , 从 松 果 到 树枝 (当然 也 包括 数 免 
子 )， 它们 可 以 应 用 于 计算 机 科学 领域 , 而 且 在 博弈 论 中 也 有 推广 (我 们 将 在 第 23 
章 中 讨论 这 个 应 用 ). 从 原则 上 说 , 翡 波 那 契 数 不 存 在 任何 奥秘 , 因为 它 有 明确 的 公 
式 , 我 们 可 以 求 出 序列 中 的 任何 项 . 在 实际 应 用 中 , 这 个 公式 显然 不 适用 于 较 大 的 
n. 虽然 我 们 可 以 求 出 互 o = 55, 但 是 计算 五 00 = 354 224 848 179 261 915 075 会 是 
件 相 当 乏 味 无 聊 的 事 . 如 果 用 纸 笔 去 计算 F2011, 则 要 引起 警觉 , 因为 它 超过 了 400 
位 数字 ! 

现在 来 展示 生成 函数 是 如 何 确定 任意 一 个 斐 波 那 契 数 的 , 而 不 必 计 算 之 前 的 任 
何 项 ! 这 个 生成 函数 是 


证 


Gr(s) 一 > Fns”. 
n=0 


我 们 单独 给 出 mn = 0 和 n = 1 时 的 项 . 当 n > 2 时 , 利用 定义 中 的 递 推 关系 
Fn = m_1 十 Zn 2 可 得 


CF(5) 一 Jo 十 is 十 DF 十 Fi_2)s” 


区 三 多 


oo oo 
一 0 十 5 十 > Fn,_1s” 十 >》， Fn_258". 
= 二 


注意 , 最 后 两 个 和 式 儿 乎 就 是 原来 的 生成 函数 一 一 不 同 之 处 在 于 s 的 方 暴 不 一 样 ， 
并 且 这 两 个 和 式 不 是 从 n = 0 开始 计数 的 . 这 个 问题 可 以 通过 提出 s 的 某 些 方 宕 ， 
然后 重新 对 和 式 进行 标记 来 解决 . 这 是 论证 中 最 困难 的 部 分 , 但 在 考察 过 大 量 例 子 
之 后 , 它 最 终 会 成 为 一 件 自然 而 然 的 事情 


| 
oa。 


Ce Ce 
GF(s)= s++s >》， P15" 11+ 8? >》, P28 
=2 T= 


Ce Ce 
一 5 十 5 > 万 5 十 52 > Eis™ 
wk n= 0 


因为 = 0, 所 以 第 一 个 和 式 也 可 以 扩展 成 从 m = 0 开始 计数 的 形式 . 上 面 两 个 
和 式 就 是 Gr(s), 于 是 有 


Gr(s)= s+sGr(s) + s2Gr(s). 
接 下 来 , 利用 二 次 公式 可 得 


S 


Gp(s) = (19.1) 


1—s—s2 

非常 好 , 我 们 已 经 确定 了 斐 波 那 契 数 的 生成 函数 : 这 对 我 们 有 什么 帮助 呢 ? 虽 
然 看 起 来 似乎 并 非 如 此 , 但 我 们 确实 取得 了 相当 大 的 进展 . 之 所 以 取得 如 此 大 的 进 
展 , 是 因为 式 (19.1) 的 左 端 和 右 端 都 是 关于 s 的 函数 . 在 等 式 的 左 端 , s" 的 系数 是 
,因此 , 右 端 s 的 系数 也 一 定 是 及. 也 就 是 说 , 目前 还 不 清楚 右 端 s” 的 系数 是 
什么 . 一 个 自然 的 想法 是 利用 几何 级 数 展 


从 而 有 
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从 这 个 等 式 中 看 出 s 的 方 容 并 不 容易 .( 但 这 是 个 很 好 的 练习 , 它 引 出 了 一 个 有 趣 的 
斐 波 那 契 数 公式 ! ) 
幸运 的 是 , 有 一 种 更 好 的 方法 来 考察 右 端的 式 子 . 这 又 回 到 了 微 积 分 中 最 不 受 
欢迎 的 一 种 积分 方法 : 部 分 分 式 . 不 必 惊 讶 , 你 的 微 积分 教授 讲 这 部 分 内 容 是 有 充 
分 理由 的 : 除了 用 在 这 里 之 外 , 部 分 分 式 还 会 在 解 微分 方程 时 出 现 . 我 们 把 1 一 s 一 s? 
分 解 成 (1 一 As)(1 一 Bs) =1- (4+B)s+ ABs?, 并 写成 
5 a b 
1—s—s2 1 一 45 1-Bs’ 

然后 用 几何 级 数 展 开 每 个 分 式 . 这 样 做 的 原因 是 , 我 们 想 利 用 几何 级 数 公式 , 所 以 
把 它 写成 了 (1 一 As)(1 一 Bs), 而 不 是 -(s- C)(s 一 万 ). 为 了 使 用 几何 级 数 公式 , 我 
们 希望 分 母 看 起 来 是 1 减 去 一 个 较 小 的 数 . 注意 , 如 果 |s| < min(1/|4|,1/|B|), 那 
么 |4s| 和 |Bs| 都 会 小 于 1, 这 样 就 能 利用 几何 级 数 公 式 了 . 
通过 简单 的 代数 运算 (或 者 利用 二 次 公式 ), 我 们 可 以 得 到 4 和 B 的 值 . 现在 
有 A4+B=1 和 4B=--1. 于 是 ,B=-1/A4 且 4-1/4=1, 或 者 42-A-1=0. 
因此 , 4 = 霸 汐 . 我 们 取 正 号 , 进行 简单 的 计算 就 可 以 得 到 B = 二 并 (如 果 取 负 号 ， 
4 和 B 的 值 就 会 颠倒 过 来 ). 

接 下 来 计算 a 入: 

5 a b _ a+b—(aB+bA)s 
1—s—s? 1-As 1-5s (1-As)(1— Bs) 

注意 , 上 面 是 一 个 等 式 , 它 必须 适用 于 s 的 所 有 值 . 由 于 分 母 是 相同 的 , 唯一 可 能 的 
情况 就 是 两 个 分 子 相等 . 每 个 分 子 都 是 关于 s 的 多 项 式 : 这 两 个 多 项 式 对 任意 一 个 
s 均 相 等 的 可 能 情况 只 有 一 种 一 一 它们 肯定 是 同一 个 多 项 式 , 也 就 是 说 它们 的 系数 
一 定 相 等 . 

看 看 常数 项 , 我 们 发 现 a 十 b= 0, 所 以 5 = 一 a. 现在 考察 s 项 的 系数 . 我 们 需 
要 让 -(aB 十 64)=1. 根据 4 和 B 的 取 值 以 及 5= -a 这 一 事实 , 我 们 有 


荆 


Un WN 
a 5 -ra 5 一 ) 
或 者 a = 1/V5, 进而 有 "= 一 1/V5. 现在 已 经 证 明 ] 
5 1 1 1 1 


SHS 二 V51—As V51—Bs 
现在 利用 几何 级 数 展开 , 于 是 有 


1 nN 1 nn 
Ons = 5 


| 
Vl 2 Vi\ 2 人 


19.2 不 义 501 
我 们 已 经 找到 并 证 明了 求 第 ”个 斐 波 那 契 数 的 公式 . 
比 内 公式 : 设 {也 ,}%> 表示 斐 波 那 契 级 数 , 其 中 Fo = 0, 让 = 1 Fnt2 = 


Ph, = 


1 /i+V5Y 1 /1_VvV5Y 
Vil 3 Vil 3 


比 内 公式 很 惊人 . 现在 我 们 可 以 直接 找到 序列 中 的 任意 一 项 , 而 不 必 计 算 之 前 


所 有 项 ! 对 此 , 我 


直 很 惊讶 斐 波 那 契 数 是 整数 , 而 这 个 表达 式 包含 了 除法 和 3 


方 根 , 但 它 最 终 却 能 给 出 整数 . 
经 过 这 么 长 时 间 的 论述 , 不 妨 回头 看 看 我 们 都 做 了 什么 . 我 们 从 斐 波 那 契 数 的 


关系 式 开始 . 虽然 可 以 
契 数 与 一 个 生成 函数 Gr(s) 联系 起 来 . 神奇 的 是 , Gr(s) 有 个 很 好 的 解析 表达 式 ， 


用 这 个 关系 式 找到 任意 一 项 , 但 非常 耗 时 . 我 们 还 把 斐 波 那 


从 中 可 以 
值得 强调 的 是 ， 


导出 斐 波 那 契 数 的 一 个 很 好 的 公式 . 


Gr(s) 的 形式 非常 好 . 如 果 随 机 取 一 个 关于 an 的 数列 , 那么 这 


种 奇迹 是 不 可 能 发 生 的 . 幸运 的 是 , 在 很 多 问题 中 , 当 on 与 我 
关 时 , 生成 函数 就 会 有 一 个 很 好 的 形式 . 

本 布 的 其 余部 分 可 以 放心 地 跳 过 . 然而 , 1 
什么 会 发 生 这 样 的 事情 . 我 


门 所 关心 的 概率 项 有 


于 奇迹 很 罕见 , 所 以 有 必要 了 解 为 
门 试图 回答 为 什么 有 必要 构造 一 个 生成 函数 . 毕竟 , 如 


果 它 与 原来 的 数据 列 相同 


又 能 得 到 什么 呢 ? 对 我 们 来 说 , 关于 斐 波 那 契 数列 的 结 
况 会 再 次 发 生 ? 生成 函数 最 重要 的 优点 是 有 助 于 简化 


论 只 是 种 幸运 , 还 是 说 这 种 情 


概率 中 的 代数 运算 . 


会 经 常 出 错 外 , 表达 式 越 复杂 , 我 们 就 越 不 容易 看 出 其 
运算 可 以 启发 我 们 找到 事物 之 间 的 联系 , 还 能 大 大 减少 计算 量 . 
我 们 举 两 个 例子 来 提醒 你 简化 代数 运算 是 多 么 有 用 . 第 一 个 例子 来 自 微 积分 ， 


我 们 不 断 强调 , 在 实践 中 , 尽量 简化 代数 运算 会 非常 有 用 . 除了 


中 的 规律 和 关联 . 简化 代数 


涉及 嵌 套 级 数 . 
考虑 下 面 的 加 法 问题 ， 计 算 
12 一 7 
十 45 一 12 
十 231 一 45 
十 7981 231 
十 9812 — 7981. 


一 种 “自然 ”的 做 法 


是 对 每 一 行 求 值 然后 相 加 , 这 样 就 得 到 了 


本 


©O 
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5 十 33 十 186 十 7750 十 1831 = 9805 


(或 者 这 至 少 是 利用 计算 器 得 到 的 结果 ). 一 种 更 快 的 方法 是 重新 分 组 (关于 分 组 证 
明 的 其 他 例子 , 请 参阅 A.3 节 ). 这 里 有 +12 和 -12, 所 以 它们 相互 抵消 了 . 类 似 的 
还 有 +45 和 一 45, 所 以 这 两 项 也 抵消 了 . 最 后 只 剩 下 


9812 一 7 = 9805， 


这 是 个 更 加 简单 的 问题 ! 撕 套 级 数 最 重要 的 应 用 之 一 出 现在 微 积 分 基本 定理 的 证 
明 中 , 用 来 证 明 曲线 y = f(x) 下 方 从 z=a 到 x=。 的 面积 等 于 (5) 一 F(a), 其 中 
Ff 是 f 的 任意 一 个 原 函 数 . 

我 们 的 第 二 个 例子 与 线性 代数 有 关 . 如 果 你 不 了 解 特 征 值 和 特征 向 量 , 也 不 必 
担心 , 因为 本 书 的 剩余 部 分 不 会 用 到 它 , 这 里 只 是 将 它 作 为 简化 代数 运算 的 另 一 个 
例子 . 考虑 下 面 的 矩阵 


A100 是 多 少 ? 如 果 你 的 概率 (或 线性 代数 ) 水 平 取 决 于 对 这 个 问题 的 回答 是 否 正确 ， 

那么 结果 会 很 不 错 . 只 要 不 出 现任 何 计算 错误 , 经 过 大 量 的 蛮 力 计算 ( 即 99 次 矩阵 

乘法 运算 ), 你 就 会 得 玉 
00 _ 922 995 834 555 169 026 354 224 848 179 261 915 0 

~ \354 224 848 179 261 915 075 573 147 844 013 817 084 101 人 


> 


如 果 把 4 对 角 化 , 那么 可 以 更 快 地 找到 答案 . 4 的 特征 值 是 = 志和 和 -1/p, 它 
们 对 应 的 特征 向 量 分 别 是 


OO 


( 记 住 , 如 果 47 = Xv 那么 了 是 矩阵 4 关于 特征 值 M 的 一 个 特征 向 量 . 换 名 话说， 
把 4 作用 于 立 并 不 会 改变 字 的 方向 一 一 只 改变 了 向 量 的 长 度 ). 令 8 = (太志 ) 且 
A= (和 0) 那么 4= SAS-!. 关键 在 于 5-15 = 了 ,其 中 了 是 一 个 2x2 的 单位 


和 矩阵. 于 是 


42 = (SAS-1)(SAS-1) = SA(S-15)A5S-1 = SA2S-1. 
更 一 般 地 ， 
4nm = 5AnS-1. 


如 果 只 想 计算 4?, 那么 需要 做 大 量 运算 , 但 当 nn 很 大 时 , 我 们 却 可 以 少 做 很 多 工作 . 
请 注意 这 与 峰 套 级 数 的 例子 有 多 相似 , 所 有 的 S-15 都 被 消 掉 了 . 
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你 
那 契 关 


那么 六 


而 不 必 


根 


如 


或 许 已 经 猜 到 了 , 这 并 不 是 一 个 随机 选择 的 矩阵 ! 这 个 入 
系 式 柬 和 = 及 十 瓦 -1( 其 中 而 =0, 玉 = 


as- 


1 


口 


1) 的 男 一 种 方 


| 


了 n+1 


Vo = 


= A"vo 
求 出 之 前 的 项 . 这 给 


上 了 比 内 公式 的 另 一 种 推 


19.3 ”生成 函数 的 唯一 性 和 收敛 性 


E 阵 出 现在 求解 斐 


. 因此 , 如 果 知 道 4” 的 表达 式 , 就 可 以 快速 算出 任 


波 


法 里 . 如 果 令 


据 序列 {an}22 0 的 具体 形式 ， 生成 函数 Gals) 


可 能 对 所 有 的 s 均 存 在 , 也 可 


和 十 其 此 


s 存在 , 还 可 能 仅 当 s = 0 时 存在 . (| 


= 


于 Gs(0) = ao, 所 以 这 没有 太 多 


!) 
碟 下 面 的 例子 . 


日 


1) 最 简单 的 情况 是 oo = 1 | 


他 项 都 满足 a = 0, 此 时 会 得 到 G。(s) = 


更 一 般 的 情况 是 , 除了 有 P 


一 个 多 项 式 . 


是 


多 个 n 之 外 , 其 余 an 全 为 0, 那么 Ga(s) 就 


力 


> 沪 


1 果 对 所 有 的 nv 均 有 a 


1, 那么 1 


几何 级 数 公式 可 得 , Ga(s)= Xo s"= 


二 . 当然, 为 了 使 
上 述 级 数 不 收 敛 . 
1 果 an = 1/nl, 那么 
有 的 s 均 存 在 . 

1 果 on = 2”, 那么 Ga( 
何 级 数 . 当 |2s| < 1 
<1/2, 那么 Ga(s) 
I 果 
该 级 数 发 散 的 方法 是 


ms >1. 


户 


下 二 对 沪 对 


上 


上 


用 几何 级 数 公 


Gals) 


因为 级 数 中 的 项 不 趋向 于 0, 所 以 级 数 不 能 收敛 . 利 月 
公式 (参见 第 18 章 ), 我 们 可 以 估算 n 必须 取 多 大 , 才能 保证 
由 斯 特 林 公式 可 知 , nl ~ 


式 , 这 里 必须 满足 |s| < 1. 对 于 较 大 的 s， 


0 s"/nl. 这 是 es 的 定义 , 所 以 G(s) 对 


5) = 部 02757 = 并 0(2s)". 这 是 比值 为 2s 的 
时 级 数 收敛 , 当 |2s| > 1 时 级 数 发 散 . 因此 , 如果 


个 


= (1—2s)-! 
an = nl, 那么 不 难看 


| 
a 


b, 对 于 任意 的 |s| > 0, Ga(s) 均 发 散 . 最 容易 看 
大 , 就 有 


对 于 任意 一 个 固定 的 s 关 0, 只 要 ”足够 
日 斯 特 林 


3| 3 .1; 


nl 


(n/e)”V2nm, 从 而 有 mls|”> (nl|s|/e)" 


. mls|” 显 


然 不 会 趋向 于 0, 因 
果 有 序列 fanjse_w 那么 


同 
公开 


为 当 


n> e/|s| 时 , 我 们 有 ms|”> 1 
然 可 以 得 到 它 的 生成 函数 ( 写 出 Gu(s) 的 解析 表达 


式 可 
在 一 个 
存在 任 
结果 极 


能 并 不 容易 , 但 


0， 
意 阶 微分 时 , 我 们 能 轻松 


重要 , 我 们 以 后 会 经 常 月 


它 确实 有 一 个 公式 ). 反之 亦 然 : 如 果 有 一 个 4 
使 得 当 |s| < 6 时 该 函数 收敛 ), 那么 我 们 训 


到 它 , 所 以 现在 有 必 


成 函数 G(s)( 存 
可 以 得 到 原来 的 序列 . 当 G(s) 
1 二 dGo(s) . 这 个 


地 得 到 这 个 序列 , 因为 此 时 有 an = 二 于 
要 把 它 作为 定理 单独 列 出 来 
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定理 19.3.1 (序列 生成 函数 的 唯一 性 ) 设 {aujseu 和 {0,}>0 是 生成 函数 分 别 
为 Ga(s) 和 Go(s) 的 两 个 数列 . 当 |s| < 6 时 , Gs(s) 和 Go(s) 均 收 敛 . 那么 , 这 
两 个 序列 相等 ( 即 对 于 所 有 的 i, 均 有 ai = bi), 当 且 仅 当 对 于 所 有 的 |s| < 5 均 有 
Ga(s) = Go(s). 通过 对 生成 函数 求 微分 , 我 们 可 以 重新 得 到 序列 : an = 二 二 fses) 


证 明 : 显然 , 如 果 a; = b;, 那么 Ga(s) = Go(s). 个 方向 , 如 果 可 以 对 
生成 函数 求 任意 阶 微分 , 那么 wm = 49s 目 b= 43296 因为 Go(s) = Go(s)， 
所 以 这 两 个 函数 的 导数 也 是 相等 的 , 从 而 有 ui = 0b. 

注 19.3.2 ” 除 以 nl 看 着 有 些 不 舒服 , 稍 后 我 们 会 看 到 另 一 个 不 包含 这 个 因子 
的 生成 函数 . 如 果 不 想来 微分 , 仍然 可 以 利用 生成 函数 来 确定 系数 . 显然 , 令 s= 0， 
我 们 就 得 到 了 ao. 接 下 来 , 观察 (Ga(s) - ao)/s 并 让 表达 式 中 的 s 等 于 0, 这 样 就 

能 求 出 ul. 按照 这 种 方式 继续 进行 下 去 , 我 们 就 可 以 来 出 任意 的 am. 当然 , 注意 这 
与 微分 方法 是 多 么 相似 ! 

最 后 是 一 个 简短 的 提醒 : 虽然 我 们 写 出 了 生成 函数 , 但 这 并 不 意味 着 它 是 有 意 
义 的 ! 遗憾 的 是 , 不 管 s 取 什么 值 (当然 , 除了 s = 0 之 外 , 此 时 平凡 地 收敛 ), 最 终 
的 和 可 能 都 不 收敛 . 幸运 的 是 , 与 概率 相关 的 生成 函数 通常 是 (但 不 总 是 ) 收敛 的 ， 
至 少 对 某 些 s 收敛 , 稍 后 我 们 将 详细 讨论 这 个 问题 . 判别 级 数 是 收敛 还 是 发 散 的 方 
法 有 很 多 , B.3 节 总 结 了 四 种 更 流行 且 更 强大 的 判别 法 (比值 判别 法 、 根 值 判别 法 、 
比较 判别 法 以 及 积分 判别 法 ). 

下 一 节 将 展示 生成 函数 如 何 与 卷 积 很 好 地 相互 作用 , 并 最 终 给 出 一 些 为 什么 生 
成 函数 在 概率 论 中 如 此 有 用 的 例子 . 


一 


19.4 “ 卷 积 I: 离散 型 随机 变量 


上 一 节 介 绍 了 生成 函数 并 给 出 了 几 个 例子 , 还 讨论 了 如 何 确定 生成 函数 的 收敛 
点 和 发 散 点 . 但 是 , 我 们 并 不 清楚 为 什么 生成 函数 是 概率 论 中 的 一 和 现 
0 题 . 在 定义 了 一 些 符 号 之 后 , 我 们 将 回 过 头 来 考察 19.1 节 中 的 问 
题 , 即 确定 两 个 随机 变量 之 和 的 概率 密度 函数 . 主要 的 结果 是 , 生成 函数 能 让 我 们 
要 地 确定 概率 密度 本 数 
首先 , 我 们 需要 一 些 符号 . 
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定义 19.4.1 (序列 的 卷 积 ) 已 知 两 个 序列 {am}%_o 和 {0b}%o. 它们 的 卷 积 被 
定义 为 下 面 这 个 新 序列 {ck}?20 
k 


ck = 00 姑 十 al 1 十 … 十 ak_101 十 Qkbo = >》 QI1DK 一 1 
1=0 


通常 情况 下 , 我 们 把 它 记 作 c 二 axb. 


这 个 定义 来 自 于 多 项 式 乘法 . 如 果 f(z) = oamzm 且 g(z) = 并 2 baz" 
并 假设 级 数 均 收 伊 , 那么 


h(z) = f(z)g(z) = 》 ckzh 
k=0 


其 中 c= ax5b. 例如 , 若 f(z)==2+3x 一 4x? 且 g(x)==5 一 x 十 xz, 那么 f(x)g(x) = 
10 二 13z 一 23z2 十 6z3 二 3z4 一 4x5. 由 定义 可 知 , cs 应 该 等 于 : 


Qaobz 十 Qa101 十 Qa2b0 二 2.0 十 3. (—1) 十 (—4) :5 = —23, 
这 恰好 是 f(x) 与 g(x) 相 乘 后 得 到 的 结果 . 


引 理 19.4.2 设 Ga(s) 是 {am}3-o 的 生成 函数 , Ge(s) 是 {bn}2o 的 生成 函数 ， 
那么 c= axb 的 生成 函数 是 Ge(s) = Ga(s)Go(s). 


关于 生成 函数 是 如 何 简 化 代数 运算 的 , 我 们 可 以 给 出 一 个 很 好 的 应 用 : 5D” _。 
(六 是 多 少 ?现在 来 算 一 下 , 当 n 较 小 时 这 个 和 是 多 少 . 如 果 n= 1, 那么 和 就 是 1; 
如 果 n==2, 那么 和 为 6; 如 果 n= 3, 那么 和 就 等 于 20, 继续 下 去 会 得 到 70 和 252 
等 . 我 们 可 能 会 意识 到 , 答案 似乎 是 (?), 但 即使 注意 到 了 这 一 点 , 又 该 如 何 去 证 明 
呢 ? 一 个 自然 的 想法 是 试 着 利用 归纳 法 . 我 们 可 以 把 (*)” 写成 (C= 1 十 (二 
(注意 , 当 m = 0 时 , 一 定 要 小 心 . ) 如 果 把 平方 式 展 开 , 我 们 会 得 到 两 个 和 式 , 它 
们 与 最 初 的 和 很 像 , 但 原来 的 n 要 蔡 换 成 n 一 1, 这些 可 以 由 归纳 法 推出 . 
于 , 还 有 一 个 交叉 项 (”)(”), 这 要 求 我 们 尽量 把 该 式 变换 成 某 个 合适 的 项 与 一 
个 形 如 ("79)” 的 项 的 乘积 

利用 生成 函数 ， 我 们 可 以 马上 得 到 答案 设 a = {am}%_o; 其 中 om = (2). 于 


Gu(sj = 3 (7 = > 人 = (1+s)" 


m=0 m=0 
( 当 看 到 这 样 的 二 项 式 和 时 , 引入 形 如 1”-™ 的 因子 是 非常 有 用 的 , 这 有 利于 使 用 二 
项 式 定理 , 即 定理 A.2.7). 
设 c= axa, 那么 由 引 理 19.4.2 可 知 , Go(s) = Gs(s)Ga(s) = Gos(s)?. 乍 一 看 ， 
这 似乎 没有 太 大 用 处 , 直到 我 们 注意 到 


并 
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n n n 2 
(人 
Can ‘==0 t=O 
这 里 用 到 了 (,”)) = ("). 因此 , 问题 的 答案 就 是 6。. 虽然 不 清楚 6 是 多 少 , 但 我 们 
知道 它 的 生成 函数 , 而 这 个 练习 的 整个 目的 就 是 为 了 说 明 , 有 时 候 知道 一 个 量 并 从 
中 推导 出 另 一 个 量 会 更 加 有 用 . 于 是 


地 


as = Go) = Ga(s)? = +ortao = Gro" = (7) 
k=0 


时 中 ,最 后 一 个 等 式 就 是 二 项 式 定理 . 因此 , ev = (2"). 

虽然 我 们 已 经 找到 了 一 个 说 明 利用 生成 函数 研究 问题 会 更 轻松 的 例子 , 但 在 
这 个 例子 中 , 有 些 东 西 并 不 令 人 满意 . 我 们 仍然 需要 一 些 组 合 学 的 专业 知识 , 注意 
(和 这 天 丰 分 和 本 首先 .这 是 天 式 天生 要 换 之 
(从 n 个 人 中 无 序 地 选 出 ! 个 人 的 方法 数 与 排除 "一 ! 个 人 的 方法 数 是 一 样 的 ) 其 
次 则 更 重要 : 为 什么 能 想到 让 序列 a 与 自身 进行 卷 积 来 解决 这 个 问题 ! 

对 第 二 个 疑 间 的 回答 是 ,在 概率 中 卷 积 无 处 不 在 、 所 以 利用 郑 积 研究 任何 一 
个 有 意义 的 进程 都 是 非常 自然 的 . 为 此 , 我 们 定义 了 概率 生成 函数 


定义 19.4.3 (概率 生成 函数 ) 设 X 是 一 个 取 整 数值 的 离散 型 随机 变量 ， 设 

Gx(s) 是 {am}%__w 的 生成 函数 , 其 中 am = Prob(X = m).， 那么 Gx(s) 被 

se 如 果 仅 当 X 取 整 数 时 概率 不 为 零 , 那么 计算 Gx(s) 的 一 个 
常 有 用 的 方法 就 是 


Gx(s) = Els*] = SS s™Prob(X = m). 


?71 一 一 CO 


更 一 般 地 , 如 果 X 在 一 个 至 多 可 数 的 集合 {zw} 中 取 值 的 概率 不 为 零 , 那么 


Gx(s) = 了 sx] = >》 szmProb(X = zm). 


mm 


Jd 


如 果 X 取 负 值 , 那么 函数 Gx(s) 可 能 会 比 我 们 看 到 的 其 他 生成 函数 稍微 复杂 
一 些 . 如 果 是 这 样 的 话 , 我 们 就 无 法 保证 Gx(0) 是 有 意义 的 ! 解决 这 个 问题 的 一 种 
方法 是 , 找到 两 个 值 a 和 6, 用 0<a<|s|<B 来 限制 s. 另 一 种 方法 是 限制 随机 
变量 不 取 负 数 , 从 而 使 这 个 问题 不 会 出 现 ! 我 们 将 集中 考察 后 一 种 情况 . 虽然 这 确 
实 会 在 一 定 程度 上 限制 我 们 研究 的 分 布 ， 人 12 章 中 , 很 多 常见 且 重 要 的 概率 
分 布 (二 项 分 布 、 儿 何 分 布 、 泊 松 分 布 、 负 二 项 分 布 .……… ) 都 取 非 负 整 数值 , 因此 
我 们 有 丰富 的 例子 和 应 用 . 
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现在 , 我 们 可 以 给 出 概率 生成 函数 的 最 重要 的 结果 之 一 . 


定理 19.4.4 设 X,… ,X 是 相互 独立 且 都 取 非 负 整数 值 的 离散 型 随机 变量 ， 


它们 的 概率 生成 函数 分 别 是 Gxi(s)…… ,Gx (s). 于 是 


GxXittXn(s) = Gxi(s)::: Gx,(s). 


证 明 : 这 是 本 主题 最 重要 的 成 果 之 一 . 你 要 认真 研读 证 明 , 直到 彻底 理解 . 我 
们 会 给 出 n = 2 时 的 完整 证 明 , 对 于 任意 的 n 则 留 给 你 自己 去 证 明 . 


从 根本 上 说 , 我 们 所 做 的 就 是 解读 定义 . 


现在 有 


Prob(X1 + X2 = 人 = 》 Prob(X1 = 1)Prop(X2 =k—1). 
/一 0 


如 果 令 am = Prob(X1 = m), bn = Prob(X2 =n) H cx = Prob(Xi + Xo = 有, 那么 
c 二 ax*b. 于 是 , Ge(s) = Ga(s)Go(s) 或 Gxi4xs(s) = Gxi(s)Gx,(s). 
n= 二 3 的 情况 又 如 何 ? 这 是 另 一 个 分 组 证 明 ( 参 见 A.3 节 ): 把 Xi 十 2 十 X2 写 


成 (XH 十 X2) 十 Xa. 把 n=2 的 结果 应 用 两 次 可 得 


GX1+X2+ Xs (s) 二 CUc +TXo)+Xs(5) 


G xi+ Xs (s)Gxs (s 


对 于 所 有 的 n, 都 可 以 采用 类 似 的 方法 论证 . 


每 当 看 到 一 个 定理 时 , 你 都 应 该 删除 一 个 假设 并 看 看 结论 是 否 仍 然 成 立 . 通 前 
立 , 其 证 明 也 会 非常 困难 ). 在 上 面 的 定 
里 中 , 随机 变量 的 独立 性 有 多 重要 ? 考察 一 种 极端 情形 , 即 当 Xs = 一 X1 时 会 发 生 
什么 . 此 时 , Xi 十 Xz 会 恒 等 于 0, 但 Gxj4xs(5) Gxi(s)G_x(s). 

上 述 内 容 说 明了 为 什么 生成 函数 在 概率 中 会 发 挥 如 此 重要 的 作用 . 


情况 下 , 答案 都 是 否定 的 ! ( 即便 结论 仍然 成 


) = Gx(s)Gx,(s)Gxs(s). 


中 


的 卷 积 ! 


对 于 相互 独立 的 离散 型 随机 变量 , 它们 和 的 概率 密度 函数 就 是 各 随机 变量 概率 


我 们 开始 了 解 为 什么 生成 函数 会 如 此 有 用 . 从 定理 19.3.1 中 , 我 们 知道 生成 函 
数 是 唯一 的 . 从 定理 19.4.4 中 , 我 们 知道 随机 变量 之 和 的 生成 函数 就 是 生成 函数 的 


乘积 . 如 果 恰 好 得 到 了 这 个 乘积 , 就 能 立刻 得 到 和 的 概率 密度 函数 ! 


为 5 的 泊 松 分 布 , 而 X2 服从 参数 为 7 的 汇 


松 分 布 . 我 们 要 考察 的 是 Xi 十 Xz. 


回 到 19.1 节 的 问题 . 现在 有 两 个 相互 独立 的 随机 变量 Xi 和 X2，X 服从 参数 


定义 19.5.1 可 知 , 如 果 和 服从 参数 为 入 的 六 


松 分 布 , 那么 它 的 生成 函数 就 是 
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= 》 Prob(X = 
1 
CS ADE A 
过 Ss 
A (As 
= 2 nl! 
= ees 至 2 
我 们 在 这 里 使 用 了 指数 函数 的 级 数 展开 式 : e* = ou?/nl. 因此 
Gx e5(s—D), Gx ee e7(s 一 1) 
根据 定理 19.4.4, 我 们 有 
CXITXo (5) 一 Gx (5s)G x (s) 


日 


二 @5(s—1) . @7(s—1) 


一 @ 


但 是 , 请 注意 el2(*-0) 就 


为 12 的 泊 松 分 布 . 正如 定 怕 


AE 


E 19. 


变量 Xi 十 X2 服从 参数 为 12 泊 松 分 布 . 


在 上 面 的 例子 中 , 我 们 注意 到 , 利 月 


做 代数 运算 容易 很 多 . 我 们 曾 在 19.1 节 


但 必须 在 分 析 中 做 一 些 巧妙 


的 处 理 . 当 使 用 生成 函数 时 , 论述 就 会 简单 很 多 . 稍 后 


12(s—1) 


个 随机 变量 的 生成 函数 , 并 且 这 个 随机 变量 服从 参数 
3.1 所 说 , 生成 函数 是 唯一 的 , 因此 可 以 推断 出 随机 


| 性 质 来 考察 Xi 十 Xs 要 比 直 接 


中 讨论 过 代数 运算 , 虽然 这 可 以 解决 问题 


和 特征 函数 . 


19.5 “” 卷 积 IT: 


我 们 会 考察 更 多 例子 , 甚至 探讨 一 些 让 代数 运算 更 加 简单 的 其 他 函数 , 即 矩 母 函 数 


连续 型 随机 变量 


幸运 的 是 , 对 离散 情形 的 论述 可 以 很 好 地 用 来 处 理 连续 型 随机 变量 . 从 根本 上 


看 , 两 者 的 唯一 区 别 在 于 , 现在 要 写 积分 而 不 是 求 和 . (积分 的 计算 会 存在 一 些微 妙 


的 技术 难点 , 我 们 会 简要 地 介绍 一 


下 . ) 虽然 一 般 的 随机 变量 并 不 一 定 是 完全 离散 


或 完全 连续 的 , 但 在 大 多 数 问题 中 , 我 们 考察 的 随机 变量 要 么 是 离散 的 、 要 么 是 连 
续 的 . 通常 情况 下 , 很 多 教材 都 会 约定 求 和 可 以 表示 积分 , 或 者 积分 可 以 表示 一 个 


和 . 这 使 得 教材 的 编写 具有 


意 一 种 . 


现在 我 们 调整 符号 ， 


大 的 灵活 


生 , 因为 一 种 符号 可 以 指 代 两 种 情况 中 的 任 


并 考察 连续 型 随机 变量 的 生成 函数 . 
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定义 19.5.1 (概率 生成 函数 ) 设 X 是 一 个 连续 型 随机 变量 , 其 概率 密度 函数 为 
刀 那么 


是 X 的 概率 生成 函数 . 


我 们 来 计算 一 些 连续 型 随机 变量 的 生成 函数 . 设 X 服从 参数 为 和 的 指数 分 布 ， 
那么 它 的 概率 密度 函数 为 


又 exp( 一 Z/ 和) 石 灿 >0 
2 人 |: 其 他 


(请 注意 , 很 遗憾 , 对 于 指数 分 布 的 概率 密度 函数 应 该 是 什么 , 作者 之 间 有 不 同 的 意 
见 : 有 些 书 会 使 用 上 面 这 种 符号 , 但 另 一 些 则 使 用 Aexp( 一 和 x). 我 更 喜欢 第 一 种 写 
法 , 因为 这 个 随机 变量 服从 参数 为 和 的 指数 分 布 , 其 均值 是 和 而 不 是 1/ 和 A. ) 因此 ， 
生成 函数 是 

Gx(s) = 让 sr exp(—2/Nde = | exp(Zlog s)exp(—7z/N)dzx. 


入 
注意 , 我 们 把 sz 改写 成 了 exp(zlog s). 不 难看 出 , 这 两 个 表达 式 取 对 数 后 是 一 样 
的 , 但 为 什么 要 这 样 做 呢 ? 记 住 s 是 固定 值 , 但 x 是 积分 变量 . 如 果 写 成 ez 而 不 是 
sz 的 形式 , 就 可 以 把 两 个 指数 因子 合并 成 一 个 因子 . ( 稍 后 , 我 们 会 考察 与 这 些 概率 
生成 函数 相似 的 函数 , 它们 会 使 得 代数 运算 更 容易 处 理 . ) 这 种 奉 换 的 目的 是 为 了 
让 积分 更 容易 计算 . 因为 s = elogs*, 所 以 


es (eg ezlogs 


li 


这 里 用 到 了 指数 运算 的 定 和 
现在 继续 求 积分 , 并 得 到 


Gx -i/ op (~ (3 108s) ) a 
0 
1 1 2 1 1 
| exp (= (#108s)) (F108s) dz. 


假设 > 一 log s > 0. 如 果 这 一 点 成 立 , 那么 被 积 函数 将 呈现 指数 型 衰减 , 而 我 们 就 可 
以 求 出 积分 值 . 如 果 它 小 于 0, 那么 被 积 函 数 就 会 呈现 指数 型 增长 , 而 这 个 积分 就 不 
存在 了 . 我 们 有 


1 i 1 
二 富 a 1—Alogs 


现在 有 必要 再 次 讨论 这 些 代 数 技巧 , 我 们 的 目标 是 让 你 使 用 这 些 方法 来 处 理 相 
关 问 题 . 第 一 个 是 改写 s*. 这 一 点 非常 重要 , 我 们 对 其 再 次 讨论 , 从 而 确保 你 能 真正 
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掌握 . 记 住 , s 是 固定 值 , 我 们 要 求 关 于 x 的 积分 . 我 们 有 一 个 关于 z 的 指数 函数 ， 
它 来 自 于 X 的 概率 密度 函数 , 所 以 我 们 自然 想到 把 s* 写成 e*1%8s = exp(z log s)， 
后 再 把 指数 部 分 合并 起 来 . 接 下 来 要 通过 变量 替换 求 积 分 , 这 就 引出 了 第 二 个 值 
得 强调 的 代数 技巧 . 我 们 有 必要 认真 地 看 一 看 这 个 积分 . 指数 部 分 的 表达 式 被 写成 
了 一 z (六 一 log s). 如 果 寺 > logs, 那么 上 述 积分 是 有 意义 的 , 因为 这 是 1 个 指数 为 
负 的 指数 函数 在 0 到 无 穷 大 上 的 积 分 , 而 且 这 个 积分 是 收敛 的 . 但 是 , 当 守 < logs 
时 , 积分 会 发 散 . 因此 , 参数 为 和 的 指数 分 布 的 生成 函数 是 


1 
1 — Alogs)-! 若 logs< 二 
co-1 ) 入 


无 定义 其 他 . 


观察 一 下 这 个 生成 函数 . 不 难看 出 , 当 logs = + 时 , 表达 式 发 生 了 显著 的 变化 , 这 
与 我 们 的 判断 相 吻 合 , 即 这 些 论述 只 适用 于 较 小 的 s. 


定义 19.5.2 (函数 卷 积 ) 两 个 函数 有 和 fo 的 着 积 , 即 有 4* fo 被 定义 为 


(fi * fo)(z es f(t)fo(z —t)d 


如 果 f; 都 是 概率 密度 函数 , 那么 上 述 积 分 收敛 . 


这 是 对 两 个 序列 卷 积 的 一 种 自然 推广 , 其 中 ck = arbx-1 变 成 了 ( 户 * 

= 了 户 扫 户 (z 下 .在 离散 情况 下 , 两 个 指标 之 和 是 一 个 新 指标 (k = /十 (K 一 站 ); 

a 情况 下 , 两 个 参数 之 和 是 一 个 新 参数 (z = 上 + (x 一 四). 毫 不 奇怪 , 对 于 连续 
型 随机 变量 , 我 们 有 类 似 于 离散 型 随机 变量 的 结果 . 下 面 给 出 最 重要 的 结果 . 


定理 19.5.3 (连续 型 随机 变量 之 和 ) 对 于 相互 独立 的 连续 型 随机 变量 , 它们 和 
的 概率 密度 函数 就 等 于 各 变量 概率 密度 函数 的 卷 积 . 具体 地 说 , 如 果 XI … ,Xi 
的 概率 密度 函数 分 别 是 所,… , 户 , 那么 Xi 十 … 十 和 的 概率 密度 函数 就 是 
万 户 * :+* fn. 


证 明 ; 虽然 论述 与 之 前 几乎 完全 相同 , 但 因为 这 一 点 非常 重要 , 所 以 有 必要 再 
次 论述 . 我 们 只 考察 两 个 随机 变量 的 情况 . 利用 与 之 前 一 样 的 分 组 论述 法 , 可 以 把 
两 个 随机 变量 推广 到 个 随机 变量 . 

设 冯 和 X 是 两 个 连续 型 随机 变量 , 它们 的 概率 密度 函数 分 别 是 及 和 户 , 并 
设 义 = Xi + 和 现在 考虑 两 个 概率 密度 函数 的 卷 积 : 


(fi * f2)(z SR fi(t)fo(z —t)d 


意 , 如 果 令 Xi + Xo = x, 那么 对 于 某 个 t, 当 Xi = t 时 , Xs 就 必须 等 于 zx 一. 
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因此 , 这 个 积分 给 出 了 Xi 十 Xo 的 概率 密度 函数 , 我 们 把 它 记 作 f. 也 就 是 说 ， 
f(x) = (万 * 户 )(Z 人 fi(t)fo(x —t)d 


现在 来 验证 } 是 一 个 概率 密度 函数 . 因为 有 和 fo 都 是 概率 密度 函数 , 所 以 它们 都 
是 非 负 的 , 用 来 定义 f(x) 的 积分 显然 也 是 非 负 的 . 我 们 必须 证 明 , f(z) 关于 全 体 > 
的 积分 值 为 1. 于 是 


/yd Ge 0 VA 
Se f(t) | 上 上 息 C-baz dt 
本 人 ck Fe | Ptodu dt 


册 A 袜 冰 


= 


在 分 析 课 上 , 我 们 经 常 被 告诫 要 小 心地 交换 积分 次 序 . 在 概率 论 中 , 积分 次 序 始终 
可 以 交换 , 这 是 因为 概率 密度 函数 是 非 负 的 , 所 以 富 比 尼 定理 一 定 成 立 (关于 交换 
积分 次 序 的 陈述 和 讨论 , 请 参阅 B.2 节 中 的 定理 B.2.1). 

我 们 不 会 证 明 关 于 n 个 随机 变量 的 结果 , 但 需要 简单 地 说 一 下 方 * 户 * 户 的 
含义 . 可 以 用 两 种 方法 来 解释 它 , 但 幸运 的 是 , 我 们 接 下 来 会 看 到 这 两 种 解释 是 一 
样 的 . (有 ix* 户 * 方 )(z) 可 以 表述 成 下 列 任 意 一 种 形式 : 


(ra to) = /AO fe a 


> u)fa(t —t—ududt 


(fi* fo)(w)fa(r — w)dw 


ts 
a < 


地 网 u)fs(z —t— ududt 


(最 后 一 个 等 式 是 通过 交换 积分 次 序 并 做 替换 w = w 十 t 来 得 到 的 ). 注意 , 这 两 种 
解释 是 相同 的 . 恰好 存在 两 种 解释 的 原因 是 , 卷 积 是 一 个 二 元 运算 : 它 以 两 个 函数 
作为 输入 , 并 将 一 函数 必须 要 成 对 地 分 组 . 因此 , 我 们 可 以 先 求 前 
两 个 函数 的 卷 积 , 再 与 第 三 个 函数 做 卷 积 , 也 可 以 先 求 最 后 两 个 函数 的 卷 积 , 然后 
再 计算 与 第 一 个 函数 的 卷 积 按照 关 似 的 施法 可 以 证 明 , 对 于 n 个 函数 的 卷 积 , 如 


(ar f2)* f3)(7) = 
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何 放置 括号 来 进行 分 组 是 无 关 紧要 的 . 

这 意味 着 卷 积 满足 结合 律 . 你 可 能 在 数学 课 上 听 过 这 个 词 . 或 许 有 位 教授 曾经 
说 过 , (关于 实数 、 关 于 复数 , 或 者 关于 和 矩阵 的 ) 乘法 满足 结合 或 者 加 法 满足 结合 
律 . 但 这 可 能 是 你 第 一 次 看 到 人 们 为 什么 要 关注 结合 律 . 它 告 诉 我 们 , 卷 积 具有 
好 的 定义 . 我 们 可 以 稍微 粗心 或 懒惰 一 些 , 不 用 写 出 括号 ， 因为 这 3 不 重要 ! 

卷 积 还 有 另外 个 很 好 的 性 质 , 我 们 有 必要 把 它 单独 列 出 来 . 


定理 19.5.4 ( 卷 积 的 交换 性 ) 两 个 序列 或 两 个 函数 的 卷 积 是 可 交换 的 . 换 句 话 
说 ,axb 一 bxo, 或 者 户 * 户 = 户 * 广 . 


任何 一 个 重要 结果 都 值得 采用 多 种 方法 来 证 明 .我 们 首先 给 出 标准 的 代数 证 
明 , 然后 讨论 一 些 其 他 的 证 明 方法 . 

证 明 这 个 证 明 可 以 通过 简单 的 代数 运算 直接 得 到 . 我 们 会 讨论 连续 函数 的 
情况 , 并 把 序列 的 相关 结果 留 作 练习 . 现在 有 
(x90= /fg dat 


= 


做 变量 蔡 换 t= x 一 wu, 那么 dt = 一 du. 当 上 的 取 值 从 -co 变动 到 ce 时 , vu 的 取 值 
则 从 oo 变动 到 -co. 于 是 


Urgm= /i ee oy=/ re 
= (g* f)(u), 


第 二 -种 证 明 只 适用 于 两 个 函数 或 两 个 序列 都 是 概率 密度 函数 的 特殊 情形 . 在 这 
种 情况 下 , f*g 有 一 个 概率 解释 : 它 是 随机 变量 Xi 十 X 的 概率 密度 函数 . 类 似 地 ， 
g* 了 是 Xs 十 Xi 的 概率 密度 函数 . 然而 , 加 法 是 可 交换 的 , 所 以 XI 十 X2 = Xo 十 Xi， 
这 意味 着 它们 的 概率 密度 函数 f *g 和 gx* 了 也 是 相同 的 . 我 真 的 非常 喜欢 这 个 证 
明 . 第 一 种 证 明 是 一 些 代数 运算 的 结果 . 通过 变量 替换 以 及 一 些 简 单 的 整理 工作 ， 
我 们 就 得 到 了 结果 . 这 个 证 明 给 人 的 感觉 更 好 . 不 难 “ 看 出 ”, 卷 积 的 交换 性 来 自 于 
加 法 的 交换 性 (也 就 是 说 , 卷 积 延续 了 这 种 性 质 ). 另 一 个 利用 交换 性 来 证 明 的 结果 
请 参阅 4.4 节 , 这 确实 是 种 非常 强大 的 技巧 . 

现在 给 出 最 后 一 个 证 明 ! 我 们 有 


Grg(s) = G4(s)Gg(s) = Go(s)G7(s) = Gorf(s). 


由 于 Gy(s) 和 G(s) 都 是 实数 , 并 且 乘 法 是 可 交换 的 , 我 们 能 轻松 地 证 明 上 面 的 代 
数 表达 式 是 正确 的 . 我 们 想 说 的 是 , 既然 生成 函数 是 相同 的 , 那么 相关 随机 变量 的 
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概率 密度 函数 也 一 定 相同 . 不 笠 的 是 , 我 们 还 没有 证 明 连 续 情 况 下 的 生成 函数 是 唯 


一 的 . 这 就 要 求 我 们 做 更 多 分 析 . 所 以 , 现在 暂时 搁置 这 个 证 明 , 并 将 其 作为 很 好 的 
思路 留 在 将 来 继续 探索 . 

前 面 证 明了 , 两 个 相互 独立 且 均 服从 泊 松 分 布 的 随机 变量 之 和 仍然 服从 泊 松 分 
布 一 那么 服从 指数 分 布 的 随机 变量 是 否 也 有 类 似 的 结果 ? 设 Xi 和 Xs 是 两 个 
相互 独立 的 随机 变量 , 分 别 服从 参数 为 5 和 7 的 指数 分 布 . 根据 上 面 的 分 析 , 只 要 
logs < min (4, 1), 它们 的 生成 函数 就 分 别 是 


CGxa(s5) (1 5log s) ; 
令 针 = Xi 十 Xo, 那么 
Gx(s) = Gxi(s)Gx,(s) 
=(1—5logs) (1 一 7logs) !. 
因为 找 不 到 和 使 得 这 个 式 子 成 为 参数 为 和 的 指数 分 布 的 生成 函数 , 所 以 我 们 很 遗 
憾 地 得 出 , 两 个 指数 分 布 之 和 不 一 定 是 指数 分 布 . 
把 真实 的 概率 密度 函数 写 出 来 并 不 难 . 由 卷 积 的 定义 可 知 , 它 就 
fxi+xa(7) = (fx fx;) (x) 
A AC 


在 计算 卷 积 时 , 学 生 最 容易 犯 的 错误 之 一 就 是 , 在 代入 fx, 和 fx， 
式 时 粗心 大 意 . 记 住 , 这 些 是 指数 分 布 的 概率 密度 
会 等 于 0. 因此 , 不 能 直接 把 fx,(zx 
时 , 才能 做 这 种 代 换 . 
显然 , 除非 x > 0, 否则 积分 值 就 等 于 0: 由 于 这 两 个 随机 变量 都 是 非 负 的 , 所 
以 它们 的 和 也 一 定 是 非 负 的 . 因为 fx, 是 参数 为 5 的 指数 分 布 的 概率 密度 函数 , 所 
以 当 上 < 0 时 , 被 积 函数 就 等 于 0. 同样 地 , 如 果 t+ > z, 那么 第 二 个 概率 密度 函数 也 
为 0. 因此 , 我 们 只 需要 考察 0< t < x: 


Petel®) = ep- 加 epCe-bndt 


5 人。 dt 
pt 汪 . 坟 一 一 一 一 和 二 
35J, “PP\ 5 7°7 


Gxs(s) = (1—7logs) . 


是 


的 具体 表达 
函数 , 当 变 量 取 负数 时 , 概率 密度 
t) 替换 成 exp( 一 (2 一 引 /7), 仅 当 zz 一 上 非 负 


_ exp(-2/7) 


35 


exp(—2/7) 


exp (—2t/35) dt 
0 


2 


[1 一 exp( 一 22/35)] 


_ emCz 四 一 em(Cz/ 


2 
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于 是 , 我 们 已 经 找到 了 和 的 概率 密度 函数 , 但 它 显然 不 是 指数 分 布 的 概率 密度 函数 . 


19.6 ”和 矩 母 函 数 的 定义 与 性 质 


注 19.3.2 中 曾 提 到 , 通过 求生 成 函数 的 微分 , 我 们 可 以 重新 得 到 原来 的 序列 . 
具体 地 说 , 如 果 a = {am}%_o 且 Ga(s) = omsm, 那么 om = 十. 但是, 因 
子 1/ml! 看 起 来 很 不 舒服 . 有 一 个 相关 的 生成 函数 并 不 包含 这 个 因子 , 它 就 是 矩 母 
函数 . 它 的 导数 并 不 是 随机 变量 取 某 个 特定 值 的 概率 , 而 我 们 其 实 也 不 希望 这 样 ! 
原因 在 于 , 连续 型 随机 变量 取 某 个 特定 值 的 概率 就 是 0. 顾 名 思 议 , 这 个 新 的 生成 
函数 将 给 出 概率 密度 函数 的 矩 . 在 给 出 定义 之 前 , 先 简要 地 回顾 一 下 和 矩 的 定义 . 


定义 19.6.1 ( 矩 ) 设 X 是 一 个 概率 密度 函数 为 上 的 随机 变量 . 如 果 X 是 离散 
的 , 并 且 仅 当 取 zm 时 概率 不 为 0, 那么 它 的 上 阶 矩 ( 记 作 以 ) 被 定义 为 


如 果 XX 是 连续 的 , 那么 

WE: zf(z)dz. 
对 于 这 两 种 情况 , 我 们 记 jy = 严 [X 台 .天 阶 中 心 矩 以 被 定义 为 ow := EE[(XX 一 4)*]. 
通常 情况 下 , 我 们 把 由 记 作 ,把 12 记 作 o2. 


当 处 理 离散 型 随机 变量 时 , 我 们 用 {zx}%__, {zm}%o 或 {zm}%_1 来 表示 
概率 密度 不 为 0 的 点 集 . 在 大 多 数 应 用 中 , 都 有 {xm}%_o = {0,1,2,…}. 现在 可 
以 定义 矩 母 函数 了 . 


定义 19.6.2 (和 矩 母 函 数 ) 设 X 是 一 个 概率 密度 函数 为 的 随机 变量 . X 的 和 


母 函数 记 作 JMx(t), 其 定义 为 Mx(b = 了 letx]. 具体 地 说 , 如 果 X 是 离散 的 , 那 
么 


如 果 和 是 连续 的 , 那么 


Mx(t) = 多 ef (zx)dzx. 


注意 , Mx(t) = Gx(e'), 或 等 价 的 Gx(s) = Mx (log s). 


当然 , 目前 还 不 清楚 Mx(t) 是 否 对 所 有 的 t 均 存在 . 经 常 出 现 的 情况 是 , 它 对 
某 些 t 存在 , 而 不 是 所 有 t. 通常 , 这 足以 让 我 们 推断 出 大 量 事 实 . 现在 来 挖 据 算 母 
冰 数 的 一 些 好 性 质 , 这 些 性 质 可 以 说 明 算 母 函数 在 概率 方面 的 作用 . 我 们 给 出 了 一 


Ll 
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IOI 


个 完整 的 证 明 , 因为 这 些 性 质 对 于 理解 中 心 极 限定 理 (第 20 章 会 给 出 该 定理 ) 的 矩 
母 函 数 证 明 是 至 关 重 要 的 . 有 许多 性 质 与 生成 函数 的 性 质 相 似 , 这 应 该 不 难 理解 ， 
因为 Mx(t) = Gx(et). 但 是 , 我 们 会 看 到 , 矩 母 函数 提供 了 更 好 的 方法 来 完成 大 部 
分 代数 运算 . (也 就 是 说 , 这 是 一 种 非常 好 的 变量 替换 ! ) 


定理 19.6.3 设 和 是 一 个 随机 变量 , /凡是 它 的 珑 . 
(1) 我 们 有 


特别 是 , p= dx(D/dt| _ 
(2) 设 a 和 [是 常数 .那么 
Max+8(t) 一 et Mx (at). 
有 用 的 特殊 情形 是 Mx 1a(t) = estMx( 和 Max(t) = Mx(at)， 当 证 
明 中 心 极限 定理 时 , M(x4g)jalt) = eSt%Mx(t/a) 也 很 有 用 . 
(3) 设 XI 和 Xo 是 两 个 相互 独立 的 随机 变量 . 当 上 < 5 时 , 它们 的 矩 母 函 
数 Mx (t) 和 Mx,(t) 均 收 敛 . 于 是 


Mxi+xa(t) = Mxi(t) Mx,(t). 
更 一 般 地 , 如 果 X1,.… ,XN 是 相互 独立 的 随机 变量 . 当 |t| < 6 时 , 它 
们 的 算 母 函数 Mx,(t) 均 收 敛 . 那么 
Mxi+...+XN (t) Mux, (t) Mx (t) Se Mxw (t). 


如 果 所 有 随机 变量 都 有 同一 个 短 母 函数 Mx (t), 那么 上 式 右 端 就 变 成 
了 Mx(t)™. 


证 明 : 为 了 方便 起 见 , 我 们 只 证 明 X 是 一 个 概率 密度 函数 为 /的 连续 型 随机 
变量 时 的 结果 


(1) 第 一 个 结论 非常 重要 (这 是 研究 矩 母 函 数 的 原因 , 也 是 其 名 字 的 来 源 ! )， 
所 以 我 们 会 给 出 两 种 证 明 . 这 两 种 证 明 是 相似 的 . 对 于 一 般 的 户 两 种 证 
明 都 需要 利用 分 析 学 中 的 一 些 结果 ; 但 如 果 只 考虑 概率 论 课 上 常见 的 户 
那么 一 切 都 很 简单 . 
对 于 第 一 种 证 明 , 我 们 要 利用 指数 函数 的 级 数 展开 式 : ee = 5 六 0 
(tz)*/k!. 于 是 有 


ID 


©O 


注意 , 上 述 积分 就 是 阶 矩 yi 的 定义 , 这 样 就 完成 了 证 明 . 注意 , 这 个 证 
明 需 要 交换 积分 与 求 和 的 次 序 . 如 果 存 在 某 个 正 数 6 使 得 , 当 |t| < 5 时 

Mx(t) 收敛 , 那么 交换 积分 与 求 和 次 序 就 是 合理 的 . 非 避 主因 的 一 点 是 ， 

你 必须 验证 其 合理 性 . 关于 何 时 能 够 交换 次 序 , 请 参阅 B.2 贡 

对 于 第 二 种 证 明 , Mx(t) 需要 求 天 次 微分 . 根据 积分 的 导数 就 是 导数 

的 积分 , 并 注意 到 在 被 积 函 数 中 与 + 有 关 的 唯一 元 素 是 因子 e*, 我 们 有 


k Co Kate oo 
下 = | [| f(x)dx = . Zeet f(x)dzr 
令 t= 0, 再 回顾 一 下 矩 的 定义 , 我 们 就 可 以 得 到 结论 . 另外 , 注意 到 这 个 
证 明 可 以 归结 为 分 析 学 中 的 论述 .此 次 交换 了 积分 与 求 导 的 次 序 (参见 
B.2.1 节 中 的 定理 B.2.2). 
(2) 现在 考察 第 二 个 结论 . 我 们 有 


Maxrp 的 = {et fl)de 
= | etez flz)dz = etMx(at), 


最 后 一 个 积分 恰好 是 矩 母 函 数 在 at 处 的 值 , 而 不 是 在 t 处 的 值 . 接 下 来 

就 可 以 轻松 地 求 出 特殊 情形 的 结果 . 
(3) 第 三 条 性 质 要 利用 下 面 这 个 事实 : 对 于 相互 独立 的 随机 变量 , 它们 乘积 的 
期 望 值 等 于 各 变量 期 望 值 的 乘积 . 如 果 Xi 与 X2 相互 独立 , 那么 eiX1 与 
etX2 也 是 相互 独立 的 ( 记 住 t+ 是 固定 值 ). 于 是 


Mx +x2(t) = Ele' 1+X2)] 


= le 


tX1etX2] 


= Ele‘*:]E[e:X?] = Mx (t) Mx,(t). 


个 随机 变量 的 情形 可 以 采用 类 似 的 方法 证 明 . 
我 们 考察 一 些 计 算 算 母 函数 的 例子 ， 看 看 它们 多 么 有 用 . 
例 19.6.4 ” 设 随机 变量 X 服从 参数 为 入 的 泊 松 分 布 , 其 概率 密度 函数 为 了 . 
这 意味 着 ， 当 n>0 时 有 
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和 me 一 ^ 


nl 


否则 , f = 0. 矩 母 函 数 为 


由 定理 19.6.3 的 第 三 条 性 质 可 知 , 如 果 XI 和 X 是 相互 独立 的 随机 变量 , 且 分 别 
服从 参数 为 和 和 As 的 泊 松 分 布 , 那么 


Mxi+ x (t) > Mx (t) Mx (t) 


oN(e'—D) ole-1) 


Pe @(N1+tA2)(e'—1) . 


这 可 能 是 你 第 一 次 在 题目 中 见 到 指数 的 指数 ! 注意 , 这 恰好 是 参数 为 Xi 十 和 2 
的 泊 松 分 布 的 矩 母 函 数 , 这 种 方法 比 蛮 力 计算 法 的 工作 量 要 少 得 多 ! 这 是 否 意 味 着 
Xi 二 X2 服从 参数 为 Xi + Xz 的 泊 松 分 布 ? 是 的 , 原因 就 是 下 面 这 条 定理 . 


定理 19.6.5 (离散 型 随机 变量 的 和 矩 母 函 数 的 唯一 性 ) 设 铸 和 YY 是 两 个 取 非 负 
整数 值 ( 即 仅 当 在 {0,1,2,:…} 中 取 值 时 , 概率 才 不 为 0) 的 离散 型 随机 变量 , 它 
们 的 矩 母 函数 Mx(t) 和 My(t) 在 |t<5 时 收敛 . 那么 ,XX 和 YY 是 同 分 布 的 , 当 
且 仅 当 存在 一 个 > > 0, 使 得 当 |t| <7 时 Mx(t)= My 人 


换 句 话说 , 离散 型 随机 变量 由 它们 的 矩 母 函数 唯一 确定 (如 果 甜 母 函数 收敛 ). 

证 明 : 这 个 方向 是 平凡 的 , 也 就 是 说 , 如 果 X 和 YY 是 同 分 布 的 , 那么 显然 有 
Mx(t) = My(). 那么 另外 的 方向 呢 ? 

由 定理 19.3.1 可 知 , 两 个 序列 famj}jg_o 和 {65;,}>%>o 相等 , 当 且 仅 当 它 们 的 生 
成 函数 相等 . 设 am = Prob(X = mm) 且 b% = Prob(Y = n). 它们 的 生成 函数 是 ( 参 
见 定义 19.2.1) 
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Gu(s) = Els*] = >》 sm"Prob(X =m) 
m=0 
Go(s) = Els’] = Ss"Prob(Y = n). 
二 人 
但 是 , 
Mx(t) 二 [e*], My (t) 一 et ] 
可 知 ， 生 成 函数 与 矩 母 函 数 之 间 存 在 一 种 非常 平凡 的 关系 . 如 果 令 s = es， 那么 
Gale’) = Mx(t) 有 Gole0 = My 的 因为 Mx(t) = My 的 ,所 以 Gale’) = Go(e)， 


密度 函数 是 相等 的 . 


面 的 定理 有 很 多 值得 兴 


) 


FE 意 的 地 方 . 


离散 型 


个 假设 . 


不 失 一 般 性 地 , 假设 zo < yo. 我 们 来 探讨 一 下 , 当 Ga(s) 等 于 Gs(s) 时 ， 
为 对 所 有 非 零 的 s 均 有 Ga(s)/s” = Go(s)/s*, 所 以 令 
因此 , 为 了 使 上 式 成 立 , 唯 


么 样 的 


ao = bo 


4 随机 变量 , 其 和 
很 多 假设 , 但 这 些 假设 都 并 不 极端 . 我 们 看 
非 负 整数 值 的 要 求 , 所 以 这 不 是 限 种 


百 打 . 因 


量 吕 


首先 假设 随机 变 引 


了 a 全 
lims_y0 syo-zo, 每 个 om 


情况 就 是 yo = zo 且 


里 仆 


= Prob(Y 


jl 性 的 假 


现在 我 们 知道 了 生成 函数 是 相等 的 , 那么 由 定型 
的 . 另外 , 这 意味 着 Prob(X = 


该 定理 非常 有 用 : 对 于 只 取 非 负 整 数值 


BE 19.3.1 可 知 , 相应 的 序列 也 是 相等 
二 让 对 所 有 的 i 均 成 立 , 因 


此 两 个 概率 


的 


设 . 如 注 


19.3.2 所 i; 


取 非 负 值 , 所 以 有 


都 满足 om A 0. 
ao = 500. 我 们 按照 这 种 方式 继续 下 去 (县 


E 母 函数 可 以 唯一 地 确定 该 变量 的 分 布 ! 虽然 定理 的 陈述 中 有 
究 和 使 用 的 大 部 分 离散 型 分 布 都 满足 取 
述 , 我 们 可 以 删除 这 


会 产生 什 
s 一 0 可 得 
可 能 的 


具体 地 说 , 我 们 重新 考 


虑 上 述 问题 , 但 此 时 两 个 函数 分 别 是 G6(s) aos** 和 Go(s) 一 aos”?). 


现在 回 到 例 19.6.4. 1 
2 的 泊 松 分 布 , 那么 它们 之 和 的 
白松 分 布 的 矩 母 函数 是 ex(e 一 1， 


; 


分 布 . 


接 下 来 看 一 
设 随 机 变量 X 服从 参数 为 和 的 指数 分 布 , 那么 当 z > 
f(z) = 和 -le-*/ 信 ; 否则 f(x) = 0. 我 们 可 以 求 出 它 的 和 


个 连续 


和 矩 母 函 


算 母 函数 可 知 , 如 果 丙 


因此 


个 随机 变量 分 别 服从 参数 为 和 和 


数 就 等 于 eOQu+raGe-) 


型 的 例子 . 


定理 


FE 坪 函 数 , 即 


于 参数 为 ^ 的 


E 19.6.5 可 以 推出 , 如 果 两 个 随机 变量 
分 别 服从 参数 为 X 和 》 的 泊 检 分布 那么 它们 的 和 就 服从 参数 为 A; + Xz 的 》 


ea 


B33 


9 机 


0 时 , 其 概率 密度 函数 
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oo 一 Z/ 入 
Mx(t) = ER 入 dz 
0 


= : ' eV -bzdz. 
和 Ao 


做 变量 蔡 换 v = (和 -1 一 xz, 于 是 dz = duw/(A-I 一 慷 . 只 要 和 -1 > t( 也 就 是 只 要 
t <1/ 和 ), 那么 被 积 函 数 中 指数 部 分 的 参数 就 是 负 的 ， a 于 是 有 


1 /™ _, du 1 2 区 
xx 的 = 于/ e | e “du = (1 一 Ab 


我 们 的 分 析 需 要 令 t < 1/ 和 . 注意 , 对 于 这 样 的 t, Mx(t) 最 终 的 表达 式 是 有 意义 的 . 
(虽然 (1 一 Xt)-! 对 于 任意 的 t 关 1/ 和 均 成 立 , 但 当 t 从 小 于 1/ 和 变动 到 大 于 1/X 
时 , 肯定 会 发 生 一 些 改 变 . ) 
如 果 Xili e {1,2}) 是 相互 独立 的 随机 变量 , 并 且 分 别 服 从 参数 为 X; 的 指数 
分 布 , 那么 由 上 面 的 例子 以 及 定理 19.6.3 的 第 三 条 性 质 可 知 Mxi4xs(t) = (1 一 
入 (1 一 和 2t)-1. 对 于 Xi 十 Xz 的 分 布 , 这 意味 着 什么 ? 是 不 是 很 好 ? 对 于 特殊 情 
形 Xi = Xs = 入 ,结果 又 如 何 ? 对 此 , 我 们 能 说 些 什 么 ? 
下 面 的 “梦想 定理 ”会 让 一 切 变 得 简单 起 来 : 概率 分 布 由 它 的 矩 唯一 确定 . 这 
是 定理 19.6.5 在 连续 型 随机 变量 上 的 自然 类 比 . 这 是 真 的 吗 ? 遗憾 的 是 , 情况 并 非 
总 是 如 此 . 
存在 具有 相同 和 矩 的 不 同 概率 分 布 . 换 句 话说, 知道 所 有 的 矩 并 不 总 是 可 以 唯一 确 
例 19.6.6 给 出 的 标准 例子 是 以 下 两 个 概率 密度 函数 , 即 当 x >0 时 ， 


1 
(7) = V2nr? 


f2(7) = fi(7z) [1 +sin(2rlogz)]. (19.2) 
通过 简单 的 计算 就 可 以 说 明 这 两 个 概率 密度 函数 具有 相同 的 矩 , 然而 两 者 具有 明显 
的 差异 (参见 图 19-1). 
哪里 出 了 问题 ? 两 个 不 同 的 概率 分 布 具有 相同 的 窍 , 这 似乎 是 荡 座 的 . 上 面 的 


ce 一 (Gog Z)/2 


例子 并 不 是 令 人 讨厌 且 应 该 被 遗忘 的 , 而 是 在 警告 我 们 这 个 问题 到 底 有 多 难以 及 技 
巧 性 有 多 强 . 这 个 例子 并 不 是 个 孤立 的 问题 , 它 说 明了 实 值 函数 可 以 多 么 奇怪 和 不 
直观 . 所 有 例子 中 最 重要 的 一 个 函数 是 

exp( 一 1/z2) 若 z 关 0 


图 19-1 式 (19.2) 中 的 及 (xz) 和 户 (z) 


看 一 下 图 形 (参见 图 19-2) 可 知 函 数 在 原点 附近 非常 平坦 . 利用 洛 必 达 法 则 , 我 们 
可 以 证 明 9 在 原点 处 的 任意 阶 导数 均 为 0. 这 具有 深远 的 意义 . 回忆 一 下 函数 在 
原点 处 的 泰勒 级 数 为 


h(z) hh(0) + (0) 0) LL 于 和 


2! 3! 


一 1.0 -0 05 1.0 
图 19-2 式 (19.3) 中 的 g(x) 


如 果 在 原点 处 的 任意 阶 导 数 均 为 0, 那么 泰勒 级 数 就 恒 等 于 0. 但 是 , g 显然 
不 恒 等 于 0. 现在 来 看 看 这 个 例子 的 要 点 . 即使 不 关心 函数 g, 你 也 一 定 会 在 意 
些 其 他 的 函数 , 比如 余弦 函数 . 虽然 余弦 函数 的 泰勒 级 数 对 于 所 有 的 x 均 收 敛 , 但 
不 垃 的 是 , cosz 十 g(x) 也 是 如 此 . 实际 上 , 由 于 这 两 个 函数 在 原点 处 的 各 阶 导 数值 
均 相 等 , 它们 在 原点 处 的 泰勒 级 数 展开 式 也 是 一 样 的 . 

好 吧 , 前 面 的 论述 告诉 我 们 为 什么 要 关心 这 个 问题 , 但 这 还 不 太 让 人 满意 . 为 
什么 离散 型 随机 变量 的 生成 函数 是 唯一 的 , 而 连 续 型 随机 变量 却 不 是 ? 我 们 不 是 一 
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次 又 一 次 地 被 告知 这 两 种 情况 基本 上 没有 区 别 , 只 是 用 不 同 的 符号 来 描述 而 已 ; 其 
中 一 个 用 和 表示 , 另 一 个 用 积分 描述 ? 就 许多 性 质 和 问题 而 言 , 这 种 说 法 是 正确 的 . 
但 是 , 这 两 种 类 型 的 随机 变量 仍然 存在 一 些 显著 的 差异 . 我 们 已 经 见 过 这 样 的 例子 : 
离散 型 随机 变量 可 以 为 [w 和 (ww 刀 指定 不 同 的 概率 , 但 连续 型 随机 变量 为 每 个 
区 间 指 定 的 概率 是 相等 的 . 对 于 只 取 整 数值 的 离散 型 随机 变量 , 其 生成 函数 就 是 所 
有 概率 的 加 权 和 . 这 就 是 它 能 被 唯一 确定 的 原因 . 对 于 连续 型 随机 变量 , 情况 则 完 
全 不 同 . 

在 线 补 充 章 节 “ 复 分 析 与 中 心 极 限定 理 ” 中 , 我 们 探讨 了 式 (19.2) 中 定义 的 函 
数 出 了 什么 问题 . 在 找到 问题 之 后 , 我 们 将 讨论 为 了 避免 出 现 这 种 情况 还 需要 假设 
哪些 额外 性 质 . 该 解决 方案 将 用 到 复 分 析 中 的 一 些 结果 , 它 会 告诉 我 们 (连续 型 随 
机 变量 的 ) 矩 母 函数 什么 时 候 可 以 唯一 地 确定 概率 分 布 . 
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我 们 只 简单 地 谈 了 谈 定理 19.6.3 的 第 一 条 性 质 . 这 是 个 非常 棒 的 表述 , 彻底 说 
明了 为 什么 要 把 Mx(t) = EleX] 称 为 矩 母 函 数 . 如 果 ( 当 然 又 是 如 果 ) 能 求 出 一 个 
随机 变量 的 矩 母 函数 , 那么 我 们 就 可 以 通过 求 导 来 轻松 地 找到 任意 一 个 矩 . 这 是 种 
非常 好 的 方法 , 它 把 求 和 或 者 求 积分 转化 成 了 求 导 . 你 应 该 很 清楚 微分 要 比 积分 容 
易 很 多 . 标准 函数 的 组 合 不 可 能 无 法 微分 一 一 反复 利用 求 导 法 则 (常数 函数 和 、 差 、 
乘积 、 商 、 肾 函数， 以 及 链 式 法 则 ), 你 最 终 会 得 到 答案 . 不 过 , 积分 难以 计算 的 函 
数 却 很 常见 (虽然 | zIn zdz, 其 至 更 糟糕 的 zln'"! zdz, 可 以 用 初等 函数 来 描述 ， 
但 它们 非常 难 计算 ). 另外 , 你 也 会 经 常 遇 到 这 样 一 些 函 数 ， 区 ! 分 无 法 用 常见 
的 解析 表达 式 来 描述 . 可 莫 的 是 , 最 常见 的 例子 是 Jexp(-z2)dz, 这 意味 着 正 态 分 
布 的 累积 分 布 函数 无 法 用 一 个 简单 的 公式 来 表示 . 


现在 来 考察 参数 为 和 的 泊 松 分 布 . 为 了 求 均 值 u, 需要 计算 个 
Se 一 全 (19.4) 
n=0 
方差 则 等 于 ee 
>》 (一 各 (19.5) 
n=0 “ 
虽然 可 以 利用 微分 恒等式 法 (参见 第 11 章 ) 来 计算 这 些 值 , 但 是 通过 求 矩 母 函 数 的 
微分 来 计算 会 相当 简单 . 在 例 19.6.4 中 , 我 们 证 明了 和 矩 母 函 数 就 是 


Mx(t) = exGe 一， 


我 们 看 看 计算 均值 和 方差 有 多 么 轻松 ， 由 定理 19.6.3 的 第 一 条 性 质 可 知 , 均 
值 为 
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d 
二 
和 (et 一 1) 
qt t=0 
= | | 
t=0 
这 个 结果 很 不 错 , 肯定 比 式 (19.4) 中 的 和 式 要 好 . 


方差 是 什么 呢 ? 为 了 求 方差 , 只 需要 计算 二 阶 矩 就 够 了 , 也 就 是 Mx(t) 在 t=0 


处 的 三 阶 导 数 . 我 们 已 经 知道 了 一 阶 导 数 , 现在 只 需要 再 次 求 导 . 于 是 有 
/2 二 Mx() a 
。 1 Bod t=0 
= [ee -DAet. Ae! 4 e*(e'-D) Met. A 人 和 + 和. 
因为 方差 等 于 二 阶 算 减 去 均值 的 平方 , 所 以 
咯 -= AL-X = 入 


为 此 , 我 们 必须 利用 乘积 的 求 导 法 则 . 相当 棒 , 这 比 式 (19.5) 中 的 和 要 好 得 多 . 
能 够 找 出 矩 是 非常 重要 的 , 现在 给 出 最 后 1 种 方法 . 我们 可 以 把 矩 母 函 数 直 


接 展开 成 震级 数 . 虽然 最 终 的 表达 式 即 便 对 + 上 的 中 等 次 数 也 会 变 得 很 复杂 , 但 把 t 
和 刀 项 的 系数 分 离 出 来 通常 不 会 有 太 大 问题 , 而 这 两 项 是 最 重要 的 . 例如, 再 看 
看 Mx(t) = exp(X(et 一 1)). 在 下 列 等 式 中 , 点 线 表示 t 的 更 高 次 数 . 由 exp(w) = 
1 十 刀 十 妈 /2! 十 :可知 
Mx(t) = 1+ (Met—1))+ (Xe! — 1) /2+ 
为 了 取得 进一步 的 进展 , 我 们 把 e{ 一 1 展 
et 一 1 二 (二 二 说 /128 十) 一 二 = 到 十 菩 /24 十 
把 它 代 入 Mx(t) 的 展开 式 可 得 
MX 王 1 上 +At 二 万 /1241 十) 十 和 2 人 十 妇 /21 十 27/21 十 …: 

二 1 十 和 十 A 和 /21 十 入 如 /2 十 … 

=1+Xt 人 -= Dp es 
注意 , 我 们 已 经 得 到 了 前 两 阶 矩 yi 和 jw 的 值 . 如 果 想 得 到 三 阶 矩 , 只 需要 把 所 有 
项 都 展 想 


到 8. 不幸 的 是 , 想 要 的 项 越 多 , 代数 运算 就 越 复杂 . 但 是 , 如 果 只 关心 前 


4 
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两 阶 矩 , 那么 不 需要 做 太 多 工作 就 可 以 把 它们 提取 出 来 . 
我 们 还 可 以 给 出 上 百 万 个 例子 , 至 少 是 大 量 的 例子 . 最 后 , 我 们 再 考察 一 个 常 
见 的 分 布 , 即 三 项 分 布 . 回忆 一 下 , 如 果 随 机 变量 X 满足 


(各 ( 工 一 站 ?一 若 ke {0,1,.…,n} 

Prob(X =k)= 4 \K 

0 其 他 . 

那么 X 就 服从 参数 为 n( 正 整数 ) 和 p( 属 于 [0,1] 的 实数 ) 的 二 项 分 布 . 为 了 求 出 均 


值 , 我 们 要 计算 ， 
Dk) 0" 
即使 考虑 特殊 情形 p = 1/2, 这 个 和 也 很 可 怕 , 它 要 求 我 们 计算 k(") 的 和 . 虽然 有 


上 他 方法 这 个 均值 和 方差 , 但 生成 函数 法 更 加 简洁 和 轻松 . 


Mx(t) = Ele’*] 

> etk (ro 一 站 PT 
k=0 

= > () etkpR(1 — 四 nm 
k=0 

=2, () (etp)*(1 — p)™® 
k=0 

a eip < 上 三 p)”, 


最 后 一 行 用 到 了 总 能 派 上 用 场 的 二 项 式 定 理 (定理 A.2.7). 注意 , 上 述 分 析 中 的 关键 
步骤 是 处 理 好 代数 运算 , 即 把 es 和 pr 组 合 在 一 起 (这 是 分 组 技巧 的 又 一 个 例子 ). 
在 考察 足够 多 的 例子 之 后 , 这 自然 会 成 为 你 的 习惯 . 这 样 做 的 原因 是 , 这 两 项 都 可 
以 看 作 某 物 的 次 方 , 因此 把 它们 放 在 一 起 是 合理 的 . 然后 , 我 们 得 到 了 (4 十 互 )"， 
其中 4 是 eip,B 是 1--py. 

为 了 得 到 均值 , 我 们 计算 Mx(t) 在 +=0 处 的 一 阶 导 , 于 是 


Nn 


= > (ep+(1—p)) | 
=n(eip+ (1— DD) .etp 


=n(p+1—p)"p = np. 


t=0 
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与 前 面 的 例子 相似 , 求 出 方差 的 第 一 步 是 找到 二 阶 矩 , 即 M%(0). 我 们 已 经 知道 了 
Mb, 所 以 现在 只 需要 再 求 一 次 微分 : 


= — Mxl(t 
H2 dt2 x( ) t=0 


n—l1 t 


d 

=|n (ep+(1-D)) ep| 

= [nn 一 1) (ep+(1 一 p))" ep .ep 十 m (ep 十 (1 一 只) etp 二 
一 7 一 JJ 二 IT 一 站 十 nnD 二 1 一 DJ p= np — np 十 TD 


现在 , 通过 一 些 简单 的 代数 运算 就 可 以 得 到 方差 : 


= 
= np — np + np— (np)’ 
=—np +np = np(l —p). 


我 们 不 考虑 求 导 , 而 是 通过 把 矩 母 函数 展开 成 关于 t 的 震级 数 来 说 明 如 何 求 
出 前 两 阶 矩 . 因为 只 需要 把 级 数 展开 到 如 项 , 所 以 我 们 忽略 了 妇 和 其 他 更 高 次 项 
(用 点 线 来 说 明 它们 是 存在 的 ). 我 们 用 到 了 ee = 1+v+2/24+… 和 (z 十)" = 
zy t+)r 十 …( 注 意 (?)=n 且 (?)= dD). 于 是 有 


(1+t+t/2+.)p+1—p)" 
1+ (tp+t2p/2+.…))" 
ST 
=14 a(tp+ tp/2+ .+ se 
Np n(n — 1)p? 2 

=1+npt1 碟 十 …。 

5 (2 2 
n2p? — np? 十 TD 9 人 2 


二 1 十 np+4 i t Bt 


这 与 前 面 yi 和 jp 的 值 是 一 样 的 . 与 泊 松 分 布 类 似 , 我 们 利用 和 矩 母 函数 成 功 地 求 出 
了 前 两 阶 矩 (但 你 应 该 对 找到 三 阶 矩 保持 警惕 ). 
希望 这 些 例子 以 及 你 应 该 尝试 的 更 多 例子 能 够 解释 清楚 为 什么 矩 母 函 数值 得 
我 们 付出 努力 去 研究 . 正如 其 名 字 所 示 , 它们 提供 了 一 个 可 以 求 出 任何 矩 的 框架 . 
一 般 来 说 , 随 着 微分 产生 越 来 越 多 的 项 , 更 高 阶 的 矩 会 变 得 难以 处 理 . 但 是 , 如 果 有 
足够 的 耐心 , 我 们 总 是 可 以 通过 这 种 方法 来 找到 答案 . 我 们 不 需要 等 待 灵光 闪现 或 
者 得 到 预见 性 的 灵感 一 一 我 非常 确信 , 只 要 有 耐心 和 微 积分 工 的 知识 就 足够 了 . 


二 
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习题 19.8.1 ”我 们 证 明了 


1 SS co k Ek 
1—(s+s2) | - ts)” = 2 OE 1 
和 
3 ot A A ly es A 
1—s—s2 >|a( 2 ) 号 ( ) 1* 
利用 这 两 个 结果 推导 出 二 项 式 系数 之 和 与 斐 波 那 契 数 的 关系 , 你 能 从 组 合 学 的 角度 给 出 
解释 吗 ? 


习题 19.8.2 ” 求 出 和 一 站 的 概率 密度 函数 , 其 中 X 和 YY 是 相互 独立 且 同 分 布 于 标准 正 态 
分 布 的 随机 变量 . 

习题 19.8.3 。” 求 出 和 一 Y 的 概率 密度 函数 , 其 中 X 和 YY 是 相互 独立 且 均 服从 正 态 分 布 的 
随机 变量 , X ~ N(Ux,ox) 且 Y ~ Nury or)， 

习题 19.8.4” 求 出 和 一 Y 的 概率 密度 函数 ,其 中 X 和 YY 是 相互 独立 的 随机 变量 , X ~ 
Exp(Ax) HY ~ Exp(Xy). 

习题 19.8.5 ”如 果 两 个 随机 变量 均 服 从 参数 为 的 指数 分 布 , 那么 求 出 它们 之 和 的 概率 密度 

习题 19.8.6 ”如 果 一 个 随机 变量 服从 参数 为 p 的 几何 分 布 , 那么 求 出 该 变量 的 矩 母 函数 . 

习题 19.8.7 ”如 果 一 个 随机 变量 服从 参数 为 的 卡 方 分 布 , 那么 求 出 该 变量 的 和 矩 母 函 

习题 19.8.8 ”给 出 一 个 用 和 矩 母 函数 表示 方差 的 公式 . 

习题 19.8.9 ” 卢 卡 斯 数列 {Z} 被 定义 为 Lo = 2, Di = 1, Ln = Ln_1 十 Ln_2( 注 意 , 它们 与 
斐 波 那 契 数 密切 相关 ). 利用 生成 函数 , 为 卢 卡 斯 数 找到 一 个 明确 的 公式 . 

习题 19.8.10 ”卡特 兰 数列 {Ch,} 有 很 多 定义 , 我 最 喜欢 的 一 个 定义 如 下 : 在 1 个 nxn 的 网 
格 上 , C 表示 从 左下 角 (0, 0) 到 右上 角 (n,n) 一 共 走 过 的 路 径 数 . 此 外 , 还 要 满足 如 下 
两 个 条 件 : (1) 所 有 路 径 都 是 向 右 或 向 上 移动 一 个 单位 ; (2) 任何 时 刻 都 不 能 位 于 主 对 
线 上 侧 (因此 , 如 果 经 过 点 (2 轧 , 那么 就 有 i 之 人 站. 找到 卡特 兰 数列 的 递 推 关 系 式 , 并 求 
出 Cn 的 明确 公式 . 

习题 19.8.11 ” 求 出 卡特 兰 数列 (其 定义 参见 上 一 题 ) 的 生成 函数 Gc(s). 当 s 取 何 值 时 ， 
Ge(s) 收敛 ? 于 C0/47 等 于 多 少 ? 

习题 19.8.12 ”解释 生成 函数 与 泰勒 级 数 之 间 的 关系 . 

习题 19.8.13 ”证 明 : 独立 随机 变量 的 线性 方差 与 矩 母 函数 和 卷 积 理论 是 一 致 的 . 


号 


习题 19.8.14 ”已 知 及 (zx) 和 f(x) 是 两 个 概率 密度 函数 . 当 x > 0 时 , 有 (7) = -十 


edos 2)/2， 户 (z) = 及 (z)[1 十 sin(2xlog zx)]. 证 明 : 这 两 个 概率 密度 函数 有 相同 的 矩 母 

函数 , 但 它们 不 是 等 价 的 . 由 这 个 结果 可 以 推出 哪些 结论 ? 
习题 19.8.15 ” 找 出 具有 相同 的 矩 母 函 数 但 并 不 等 价 的 两 个 函数 的 男 一 个 例子 . 
习题 19.8.16 ”利用 代数 方法 证 明 : 卷 积 在 离散 情况 下 是 可 交换 的 . 
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习题 19.8.17 ”证 明 : 卷 积 通常 满足 结合 律 . 具体 地 说 , 对 于 n 个 概率 密度 函数 的 卷 积 , 我 们 
如 何 分 组 无 关 紧要 . 例如 , (fi 户 ) * ( 户 * 所 ) 等 于 ( 户 *( 户 * 户 ))* 户 . 

习题 19.8.18 “如果 两 个 随机 变量 服从 参数 相同 的 指数 分 布 , 那么 求 出 它们 之 和 的 概率 密度 
函数 . 你 能 不 能 只 通过 修改 书 中 关于 参数 不 同时 的 论述 来 得 出 答案 ? 如 果 不 能 , 请 考虑 下 

列 情形 : 和 2 = 入 且 和》i 一 入 如 果 研 究 过 递 推 关系 , 那么 这 种 考察 其 中 一 个 参数 极限 的 方 

法 就 类 似 于 求解 重 根 的 递 推 关系 式 . 

习题 19.8.19 ”计算 例 19.6.6 中 两 个 概率 密度 函数 的 和 矩 , 并 观察 它们 是 否 相等 . 

习题 19.8.20 ”证 明 : 在 式 (19.3) 中 , 函数 g(z) 在 0 处 的 任意 阶 导数 均 为 0. (提示 : 利用 洛 
必 达 法 则 . ) 

习题 19.8.21 ”回顾 一 下 通过 展开 算 母 函数 来 计算 算 的 方法 . (a) 求 出 参数 为 和 的 泊 松 分 布 
的 3 阶 矩 . (b) 求 出 参数 为 n 和 p 的 二 项 分 布 的 三 阶 矩 ， 

习题 19.8.22 。” 求 出 矩 母 函数 为 


的 (唯一 ) 离散 型 随机 变量 X. 
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给 我 一 根 足够 长 的 杠杆 和 一 个 支点 , 我 可 以 援 起 地 球 . 


中 心 极限 定型 


中 通常 可 以 得 到 满足 . 令 人 惊讶 的 是 其 
立 的 “好 ” 随机 变量 ， ll 它们 的 和 将 收敛 于 高 斯 分 布 , 而 


E (CLT 


高 斯 分 布 的 均值 


在 快速 陈述 了 中 心 极 限定 旭 
心 极 限定 到 


慢 地 展开 讨论 . 中 ， 


为 什么 前 者 是 个 自然 


) 


是 概率 论 中 的 真正 瑰宝 之 一 . 它 的 假设 很 弱 ， 


一 一 阿 基 米 德 


并 且 在 实践 


结果 的 


由 这 些 独立 变量 的 均值 


普遍 性 . 简 而 言 之 , 对 于 一 些 相互 独 


和 方差 确定 . 


论 标 准 


化 随机 变量 的 正 
中 心 极限 定理 的 证 


方法. 


E 之 后 , 我 们 将 通过 回顾 
E 包 括 两 部 分 : 被 考察 的 量 ， 
人 们 经 常 忽视 这 个 被 考察 的 量 , 而 是 把 重点 放 在 极限 性 


证 明 2 


项 前 面 的 一 些 概 念 来 仔细 而 绥 
以 及 这 个 量 会 趋向 于 什么 . 
质 上 . 我 们 希望 你 能 明白 这 


i 重要 的 研究 对 象 . 因此 , 我 们 会 快速 回顾 均值 和 方差 , 并 讨 
Ff 
E 明 方法 有 很 多 种 . 


间 有 差异 通 币 是 因为 假定 的 基本 


随机 变量 的 数量 不 同 . 本 章 将 集 
的 矩 母 浪 数 在 原点 的 菜 领 域内 收敛 . 4 


变量 


到 的 大 多 数 随机 变量 都 


个 非常 有 用 的 定理 


果 你 继续 学 习 概 率 论 


:在 
我 们 将 给 出 较 弱 条 件 下 的 证 
(或 大 部 分 数学 


上 满足 这 个 限制 . 因 
第 21 草 以 及 在 线 邓 


讨论 独立 同 分 布 的 随机 变量 之 和 ，, 而 
FE 一 看 ， 这 似乎 是 


且 这 些 随 机 
性 条 件 , 但 我 们 遇 


限制 


此 即使 有 这 个 假设 , 我 们 仍然 可 以 得 到 


充 章 节 “ 复 分 析 与 中 心 极限 定理 ”中 ， 


明 , 但 这 会 用 到 


就 是 我 们 要 花 时 间 介 绍 这 些 主题 的 原因 . 


在 花费 大 量 
述 我 们 将 要 做 什么 、 
做 什么 样 的 假设 才能 
来 , 而 是 简单 地 介 


准 化 随机 变量 2 


二 (Xi1 十 … 


20.1 


on 


它们 的 均值 是 


傅 里 时分 析 与 复 分 析 中 的 一 坚 结果 . 如 
分 文 ), 将 


会 看 到 这 两 个 领域 中 的 大 量 内 容 , 这 


证 明 的 关键 思路 


篇 幅 曾 述 中 心 极限 定理 的 证 明细 节 之 前 , 我 们 要 花 些 时 
为 什么 这 利 
顺利 地 得 到 结 
一 下 方法 , 并 

我 们 假定 读者 比较 熟悉 
一 些 独 立 同 分 布 的 “好 ”随机 变量 X;, 并 且 
:十 Xn 一 np)/ovVn( 均 值 为 0 且 方 差 为 1) 在 某 种 意义 


间 来 高 度 概 


证 明 方法 可 行 、 为 什么 这 个 证 明 行 不 通 , 以 及 需要 
果 . 因此 , 本 节 的 
E 动 接 下 来 的 代数 运算 . 
中 心 极限 定理 的 内 容 . 对 我 们 来 说 , 这 意味 着 如 果 存 在 


目的 不 是 将 所 有 细节 都 考虑 进 


是 4 且 标 准 差 是 o, 那么 标 
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上 会 收敛 于 服从 标准 正 态 分 布 的 随机 变量 Z. 确切 地 说 , 这 个 和 如 何 收敛 取决 于 我 
们 对 随机 变量 的 假设 . 事实 上 , 这 就 是 要 为 “好 ”上 加 引号 的 原因 : 为 了 确保 论述 
的 严谨 或 者 为 了 实现 某 种 程度 的 收 和 敛 , 我 们 需要 假设 随机 变量 满足 某 些 特定 性 质 . 
不 难 理解 , 我 们 假设 得 越 多 , 得 到 的 结果 就 会 越 强 . 这 里 的 思路 类 似 于 第 17 章 马尔 
可 夫 不 等 式 与 切 比 雪夫 不 等 式 之 间 的 差异 . 
我 们 要 利用 第 19 章 的 矩 母 函数 . 因此 , 对 于 给 定 的 X, 有 


Mx(t) = Ele*] = _ efx(z)dr = 


n=0 

Mx(t) 在 t=0 处 的 值 最 容易 计算 , 因为 fx 是 一 个 概率 密度 函数 , 所 以 我 们 始终 
有 Mx(0) = 0. 我 们 的 论证 要 求 Mx(t) 在 以 t= 0 为 中 心 的 小 邻 域内 存在 . 不 幸 的 
是 , 有 时 候 不 存在 这 样 的 邻 域 ! 例如 , 考虑 一 个 服从 柯 西 分 布 的 随机 变量 , 当 上 > 0 
时 上 述 积分 是 发 散 的 , 所 以 我 们 找 不 到 收敛 区 间 . 幸运 的 是 , 对 于 大 多 数 标准 概率 
分 布 来 说 , 这 并 不 是 个 很 强 的 条 件 , 并 且 存 在 某 个 6 > 0, 使 得 当 |t| < 6 时 Mx(t) 
收敛 . 

证 明 思 路 如 下 : 为 了 证 明 有 收敛 于 服从 标准 正 态 分 布 的 随机 变量 2Z, 我 们 只 
需要 证 明 当 |t| < 5 时, Mz (t) 一 Mz(). 虽然 矩 母 函数 的 收敛 性 貌似 蕴含 着 相应 
概率 密度 函数 的 收敛 性 , 但 这 是 证 明 中 最 难 的 一 步 . 为 了 正确 地 说 明 这 一 点 , 我 们 
需要 利用 复 分 析 中 的 几 个 主要 定理 . 我 们 不 去 证 明 这 些 定理 , 而 是 在 稍 后 陈述 , 并 
给 出 关于 为 什么 这 是 一 个 自然 定理 的 论述 . 

简单 地 说 , 我 们 想 证 明 


lim efz, (z)dz = efz(zx)dx 更 含 lim fz, = fz. 


也 一 CO 
一 De 


如 果 忽 略 了 这 里 的 极限 (注意 这 里 的 “如 果 ”, 因为 积分 的 极限 并 不 总 是 等 于 极限 的 
积分 一 一 参阅 习题 20.11.4), 那么 我 们 要 证 明 的 就 变 成 了 


/ e 刀 jz)dz = etg(z)dz 下 含 着 lim f= 9. 


为 什么 会 这 样 呢 ? 思想 是 , 对 于 一 大 类 测试 函数 , f 和 9 都 有 相同 积分 的 唯 
方法 就 是 两 者 相等 . 我 们 有 无 穷 多 个 相等 的 积分 , 测试 函数 是 ez, 其 中 -5 <t<5. 
我 们 没有 深入 复 分 析 研究 为 什么 这 些 积分 相等 就 意味 着 函数 相等 , 现在 只 考虑 

个 更 简单 的 例子 , 并 希望 这 个 类 比 具 有 说 服 力 并 且 是 可 信 的 . 假设 对 于 所 有 的 h， 
有 


1 h(x)f(z)drz = 凡 h(x)g(z)dz (20.1) 


这 是 否 意味 着 f = g? 不 一 定 , 如 果 f= 9 在 除了 某 一 点 之 外 的 任何 地 方 均 成 立 , 比 
如 了 (0) = g(0) 十 1, 那么 积分 不 会 受到 任何 影响 . 因此 , 不 妨 设 f 和 g 是 连续 的 (可 
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以 把 这 个 假设 看 作对 中 心 极限 定理 中 “好 ”概率 密度 函数 的 类 比 ). 这 样 就 够 了 吗 ? 

令 人 惊讶 的 是 , 答案 是 肯定 的 , 我 们 只 需要 让 式 (20.1) 中 的 h 是 分 段 连 续 的 即 
可 . 假设 积分 是 相等 的 , 但 f 和 g 在 某 个 点 处 的 值 不 同 . 不 失 一 般 性 , 可 以 假设 这 
个 点 是 xz =0, 也 可 以 调整 函数 使 得 f(0) = 1 且 g(0) = -1. 因为 上 和 9 是 连续 的 ， 
所 以 在 0 附近 存在 1 个 小 区 间 使 得 f(x) > 1/2 且 g(x) < 一 1/2, 不 妨 把 这 个 区 间 设 
为 [一 汶川. 现在 令 


m={ 若 ze [一 本 
0 其 他 . 


注意 到 


类 似 的 计算 表明 h, 和 9 的 积分 值 小 于 或 等 于 -1. 因此 , 式 (20.1) 不 能 对 所 有 
均 成 立 , 这 是 个 矛盾 ! 所 以 , 我 们 必须 令 f = g! 

我 们 已 经 结束 了 有 关 预 备 知识 的 题 外 话 . 事实 证 明 , 这 是 高 等 数学 中 的 一 种 强 
大 技巧 : 证 明 两 个 函数 相等 的 一 种 方法 是 证 明 它们 关于 一 大 类 测试 函数 有 相同 的 
积分 . 当然 , 困难 在 于 (1) 证 明 存 在 大 量 测 试 函数 可 以 产生 相等 的 积分 , (2) 证 明 积 
分 相等 会 迫使 函数 相等 . 这 些 计算 肯定 有 些 问 题 . 如 果 不 知道 被 积 函 数 是 什么 , 我 
们 该 如 何 证 明 积 分 相等 呢 ! 记 住 CLT 的 一 个 要 点 是 , 概率 密度 函数 的 精确 卷 积 公 
式 使 用 起 来 很 痛苦 . 解决 办 法 是 利用 极限 . 我 们 不 去 证 明 积分 相等 , 而 是 证 明 某 些 
极限 是 相等 的 . 当然 , 虽然 这 让 问题 变 得 更 容易 , 但 又 会 带 来 男 一 个 麻烦 , 因为 现在 
必须 要 和 弄 清 楚 极限 与 积分 是 如 何 相互 作用 的 (正如 本 章 末尾 的 习题 所 说 , 比如 习题 
20.11.4, 它们 的 相互 作用 可 能 会 很 糟糕 ! ) 
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我 们 在 概率 中 见 过 许多 分 布 , 其 中 最 重要 的 就 是 正 态 分 布 . 衡量 某 个 量 或 概念 
对 某 个 主题 重要 程度 的 一 种 方法 是 , 看 一 看 我 们 使 用 了 多 少 个 不 同 的 名 称 来 指 代 
它 . 对 这 个 分 布 而 言 , 其 名 称 包 括 正 态 分 布 、 高 斯 分 布 和 钟 形 曲线 . 


定义 20.2.1 ( 正 态 分 布 ) 如 果 随 机 变量 X 的 概率 密度 函数 是 
1 (z—1)? 

V2Ta2 ep 人 202 上 

那么 X 就 服从 均值 为 几 且 方差 为 o? 的 正 态 分 布 (或 高 斯 分 布 ). 我 们 常 把 它 记 

作 和 ~ N(n,0?). 如 果 1=0 且 ao2=1, 那么 说 和 服从 标准 正 态 分 布 . 


f(z) = 
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中 心 极限 定理 有 很 多 版 本 . 它们 之 间 的 区 别 既 包括 假设 条 件 又 包括 最 终 的 收 
敛 类 型 . 毫 不 奇怪 , 我 们 假设 的 性 质 越 好 , 收敛 性 就 越 强 , 证 明 也 就 越 简单 . 接 下 来 
给 出 的 这 个 定理 虽然 不 是 最 一 般 化 的 , 但 很 容易 陈述 , 并 且 我 们 遇 到 的 大 多 数 常 见 
分 布 都 能 满足 它 的 假设 . 

定理 20.2.2( 中 心 极 限定 理 (CLT)) 设 XX,… ,XN 是 独立 同 分 布 的 随机 变量 ， 
存在 某 个 6 > 0, 使 得 当 | < 5 时 它们 的 短 母 函数 收敛 (这 意味 着 所 有 算 均 存在 
且 有 限 ). 用 j 表示 其 均值 , o? 表示 方差 . 令 


区 
| 一 N 
且 
XN—h 
ZN = ss 
Md o/VN 


那么 , 当 N 一 co 时 ，2 的 分 布 会 收敛 于 标准 正 态 分 布 (相关 陈述 参见 定义 
20.2.1). 


解释 上 述 内 容 的 一 种 方法 如 下 : 不 妨 设 Xi,… , XN 是 描述 某 个 过 程 或 某 种 现 
象 的 N 个 相互 独立 的 测量 值 . 那么 vy 就 是 这 些 值 的 平均 数 . 因为 X; 取 自 均值 
为 4 的 某 个 常见 分 布 , 并 且 期 望 具有 线性 性 质 , 所 以 


N 
J nt ll 
BEwl = 了 | 二 | = WD = = 
由 Xi; 的 独立 性 可 知 , vy 的 方差 是 
三 1 之 1 a2 
三 下 
Var(XN) = va ( ) 到 2 = N= 


因此 了 vy 的 标准 差 是 o/VN. 注意 , 当 N 一 co 时 , 承 y 的 标准 差 趋向 于 0. 这 就 引 
出 了 下 列 解释 : 随 着 测量 次 数 的 不 断 增加 , 平均 值 的 分 布 会 越 来 越 接 近 于 真实 的 均 
值 . 把 X， 的 平均 值 记 作 对 y 是 为 了 强调 我 们 有 N 个 随机 变量 的 和 . 

弄 清 楚 什么 是 正 态 分 布 非常 重要 . 它 描 述 的 不 是 单独 的 Xi, 这 些 XX; 可 以 服 
从 任意 一 个 “好 ”的 分 布 . 服从 正 态 分 布 的 是 X; 的 平均 值 . 令 人 惊讶 的 是 , 平均 
值 的 分 布 似乎 与 X; 的 分 布 形状 无 关 . 这 应 该 是 错觉 , 平均 值 怎么 可 能 与 选取 随 
机 变量 的 分 布 无 关 呢 ? 事实 上 , 平均 值 确实 与 最 初 的 分 布 有 关 , 然而 这 种 关系 非 
常 微弱 ， 我 们 的 意思 是 , 基本 分 布 的 形状 决定 了 正 态 分 布 的 收敛 速度 ( 贝 里 - 埃 森 
定理 ). 
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20.3 均值、 方差 与 标准 差 


虽然 之 前 已 经 讨论 过 均值 、 方差 和 标准 差 , 但 是 有 必要 花 些 时 间 再 仔细 地 看 一 
下 这 些 概念 , 因为 它们 在 本 章 其 余部 分 中 发 挥 着 关键 的 作用 . 正如 我 们 之 前 所 说 的 ， 
在 数学 课 上 , 你 很 容易 面临 这 样 的 状态 : 你 可 以 逐 行 看 懂 证 明和 论述 , 却 不 明白 作 
者 为 什么 会 这 样 做 . 你 对 基本 概念 越 熟悉 , 就 越 有 可 能 理解 证 明 中 的 论述 次 序 . 


回忆 一 下 , 对 于 概率 密度 函数 为 f 的 随机 变量 X, 其 均值 / 和 方差 o? 的 定义 如 
下 : 如 果 X 是 一 个 连续 型 随机 变量 , 那么 


1 三 下 


=- = 人 本 


如 果 X 是 离散 的 , 那么 


标准 差 是 方差 的 平方 根 . 
我 们 通常 把 X 的 方差 写成 Var(X). 均值 用 来 度量 X 的 平均 值 , 方差 则 用 来 
述 变 量 是 如 何 分 布 的 (方差 越 大 , 概率 密度 函数 就 越 分 散 ). 
考虑 以 下 两 个 数据 集 : 
Ss: = {0,0,0,0,0,0,0,0,0,0,100,100,100,100,100,100,100,100,100,100} 
S2 = {50, 50, 50, 50, 50, 50, 50, 50, 50, 50, 50, 50, 50, 50, 50, 50, 50, 50, 50, 50}. 


这 两 个 数据 集 的 均值 都 是 50, 但 第 一 个 集合 的 数据 显然 比 第 二 个 更 加 分 散 . 如 果 试 
着 计算 这 两 个 集合 的 方差 , 我 们 就 会 遇 到 一 个 问题 : 概率 f(zn) 是 多 少 ? 除非 有 其 
他 不 同 的 信息 , 否则 人 们 通常 假定 所 有 点 的 概率 相等 . 现在 有 两 种 方法 来 计算 概率 . 


我 们 来 看 一 看 951， 第 一 种 方法 是 把 每 个 观察 结果 都 视 作 不 同 的 测量 值 . 在 这 种 情 
况 下 ， Xl1 TX2 X10 0, Z11 X12 X20 100， 并 目 每 个 值 的 概率 均 
为 1/20. 第 二 种 方法 是 , 认为 zi = 0 的 概率 是 1/2, zs = 100 的 概率 是 1/2. 但 是 


CN 
安 壮 导 ， 


虽然 这 两 种 解释 考察 的 数据 点 的 个 数 不 同 , 但 被 计算 的 量 是 一 样 的 . 例如 ， 
我 们 用 这 两 种 方法 来 计算 方差 . 利用 第 一 种 方法 , 可 以 看 到 方差 是 


©O 
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= 


第 二 种 方法 的 结果 则 是 


0_502. 工 1 和 000_502. 工 
20 所 20 


1 1 
. 2 . 人 
10 .50 20 十 了 50 20 


1 
2 . | 


1 
1 人 
(100 5 


一 502. 


一 502, 


对 于 第 二 个 集合 52, 方差 会 更 容易 计算 . 所 有 值 都 相同 , 因此 方差 显然 为 0. 


值 和 方差 . 
不 难 


所 I AAA 一 
有 上 山下 一 


仆 数据 集 的 方差 要 上 
的 分 布 情况 会 让 人 有 些 不 安 . 当 这 些 数 具 有 物理 意义 时 ， 


两 个 数据 集 记 录 了 等 待 银行 出 纳 员 的 时 间 (以 秒 为 单位 ). 


第 一 个 小 得 多 然而, 用 


作为 一 个 很 好 的 测试 , 证 明 不 管 x; 等 于 多 少 , 这 两 种 方法 总 


么 是 0 秒 , 要 么 是 50 秒 , 要 么 是 100 秒 . 在 这 两 家 银行 中 , 顾客 的 


一 样 的 . 然而 , 在 第 二 家 银行 中 , 所 有 客户 上 
非 


有 些 客户 可 能 会 因为 没有 等 待 而 感到 


是 给 出 相同 的 均 


方差 来 量化 数据 


困难 就 来 了 . 例如 , 假设 这 
那么 , 我 们 的 等 待 时 间 要 


平均 等 待 时 间 是 


很 长 时 间 而 感到 烦躁 . 这 一 点 可 以 通过 方差 看 出 来 : 第 二 个 全 


个 集合 的 方差 是 502 = 2500. 不 过 , 这 样 说 并 不 完全 正太 
考虑 到 方差 的 单位 . 因为 时 间 是 以 秒 为 单位 计算 的 , 所 以 
白地 说 , 我 不 知道 什么 是 平方 秒 . 我 可 以 想象 


J 等待 时 间 都 一 样 ; 但 在 第 一 家 银行 中 ， 
常 高 兴 , 而 其 他 客户 则 几乎 肯定 会 因为 等 待 
合 的 方差 是 0, 但 第 

正确 . 在 这 种 情况 下 , 我 们 要 
方差 的 单位 是 平方 秒 . 坦 

F 方 米 (面积 ), 但 平方 秒 是 什么 ? 然 


此 , 方差 用 平方 秒 来 测量 . 


而 , 它 正 是 这 里 出 现 的 单位 . 为 了 弄 清楚 这 一 点 , 我 们 注意 到 x; 和 jy 都 是 以 秒 为 
单位 来 测量 的 , 而 概率 是 无 单位 的 , 所 以 方差 是 形 如 (0 秒 -50 秒 )?、(50 秒 -50 秒 )? 
以 及 (100 秒 - 50 秒 )? 这 样 的 表达 式 之 和 . 因 


如 果 想 知道 自己 需要 等 待 多 长 时 间 , 我 希望 得 到 的 回答 是 “10 分 钟 左右 , 快 或 


慢 1 分 钟 或 者 2 分 钟 ”而 不 是 “10 分 旬 


这 个 问题 有 个 简单 的 解决 方案 . 
适 , 而 标准 差 就 是 方差 的 平方 根 . 


回 到 之 前 的 例子 . 对 于 第 一 个 数据 集 , 平均 等 待 时 间 是 50 秒 
而 在 第 二 个 数据 集中 , 它 是 平均 等 待 时 间 也 是 50 秒 , 但 标准 差 是 0 秒 . 


左右 ,方差 是 1 或 43 
通常 情况 下 不 需要 报告 方差 , 给 出 标准 差 会 更 加 合 


标准 差 是 50 秘 ， 


上 述 内 容 的 要 点 是 , 标准 差 与 均值 有 相同 的 单位 , 但 方差 和 均 


值 的 单位 则 不 同 . 


我 们 总 是 把 苹果 与 苹果 做 比较 (也 就 是 说 , 比较 同一 维度 下 的 对 象 ). 事实 上 , 这 就 


是 为 什么 方差 的 符号 是 o2, 它 强 调 了 我 们 经 常 关心 的 量 是 c, 即 方 差 的 平方 根 . 类 


似 于 把 X 的 方差 写成 Var(X), 我 们 偶尔 会 把 标准 差 写成 StDev(X). 


20.4 标 


准 化 


在 上 一 节 中 , 我 们 看 到 随机 变量 的 方差 不 是 衡量 波动 水 平 的 


E 确 尺度 , 因为 方 
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差 的 单位 是 错误 的 . 特别 是 , 如 果 和 是 以 秒 为 单位 测量 的 , 那么 方差 的 单位 就 是 神 
秘 的 物理 单位 “平方 秒 ”. 标准 差 与 X 具有 相同 的 单位 , 所 以 我 们 用 标准 差 来 描述 
数据 集 的 分 布 情况 . 

找到 讨论 问题 的 正确 尺度 或 单位 是 非常 重要 的 .下 面 给 出 一 个 例子 , 假设 有 
门 微 积分 课 , 其 中 的 学 生 完 全 相同 , 但 教授 不 同 (当然 , 这 不 是 完全 现实 的 情况 , 因 
为 不 存在 完全 相同 的 两 个 班级 , 但 如 果 班 级 足够 大 , 那么 这 种 说 法 几乎 是 可 行 的 ). 
我 们 假设 其 中 一 位 教授 给 出 的 考试 题 非常 简单 , 而 另 一 位 则 给 出 了 非常 有 挑战 性 
的 题目 ， 如 果 参 加 第 一 门 考试 的 Hari 得 到 的 平均 分 是 92 分 , 参加 第 二 门 考试 的 
Daneel 得 到 了 84 分 , 那么 哪个 学 生 更 优秀 呢 ? 如 果 没 有 更 多 信息 , 我 们 很 难 给 出 
判断 一 一 该 如 何 比 较 “ 较 简单 ”考试 的 92 分 与 “ 较 难 ”考试 的 84 分 呢 ? 

假设 我 们 对 这 两 门 课 有 更 多 的 了 解 . 不 妨 设 第 一 门 课 (考试 较 简单 的 那 门 课 ) 
的 平均 成 绩 是 97, 而 标准 差 是 1; 第 二 门 课 的 平均 成 绩 是 64, 且 标 准 差 是 10. 一 旦 
得 到 了 这 些 信息 , 那么 Daneel 很 明显 是 更 优秀 的 学 生 .( 记 住 , 在 这 个 例子 中 , 我 们 
假设 两 个 班级 中 学 生 的 能 力 是 一 样 的 . 唯一 的 区 别 是 其 中 一 门 考试 比 另 一 门 更 简 
单 . ) 实际 上 , Hari 的 成 绩 低 于 平均 水 平 ( 低 了 5 个 标准 差 , 这 是 个 相当 大 的 数 ), 而 
Daneel 则 明显 高 于 平均 水 平 (高 出 2 个 标准 差 ). 

要 提防 把 苹果 和 橘子 做 比较 , 而 这 正 是 现在 发 生 的 事情 一 一 我 们 有 两 个 不 同 的 
尺度 , 一 个 尺度 上 的 84 并 不 等 于 另 一 个 尺度 上 的 84 . 为 了 避免 出 现 这 样 的 问题 
( 即 要 在 苹果 之 间 做 比较 ), 我 们 经 常 将 数据 标准 化 , 从 而 使 其 均值 为 0 且 方差 为 1. 
这 样 就 把 不 同 的 数据 集 放 在 了 同一 个 尺度 上 . 具体 做 法 如 下 . 


定义 20.4.1 (随机 变量 的 标准 化 ) 设 X 是 一 个 均值 为 J 且 标 准 差 为 o 的 随机 
变量 , 并 且 J 和 o 都 是 有 限 的 . X 的 标准 化 变量 2 被 定义 为 
和 -EXZ XX- 


EE 


= 


StDev(X) vo 


[2] = 0 且 StDev(2) = 1. 


这 里 讨论 的 标准 化 过 程 是 非常 自然 的 , 它 把 任意 一 个 “好 ”随机 变量 重新 调整 
为 均值 为 0 且 方 差 为 1 的 新 变量 . 我 们 需要 的 唯一 假设 是 , 这 个 变量 存在 有 限 的 均 
值 和 标准 差 . 这 是 个 温和 的 假设 , 但 并 不 是 所 有 的 分 布 都 能 满足 这 一 点 . 例如 , 考 
虑 柯 西 分 布 


1 1 
Jo) = F147 


这 个 分 布 是 否 存 在 均值 是 有 争议 的 , 它 显 然 没 有 有 限 的 方差 . 这 个 分 布 的 均值 为 什 
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么 会 有 问题 ? 因为 这 里 有 个 反常 积分 , 它 的 被 积 函数 有 时 为 正 . 有 时 为 负 . 这 意味 
着 积分 限 趋向 于 无 穷 大 的 方式 会 对 积分 值 产生 影响 . 例如 


4 
im / = 
A—o0_A T(1 十 Z2) 4 一 co 


但 是 


24 ydz 1 /2 vdr 
we _A 工 ( 工 十 2Z2) bei) 1+ zx2 
对 于 相当 大 的 4, 最 后 一 个 积分 其 实 就 是 及 dz/z = log(24) -log(4) = log(2). 因 
此 , 趋向 于 无 穷 大 的 方式 很 重要 ! 
为 了 保持 完整 性 , 我 们 看 看 如 何 对 一 个 随机 变量 做 出 调整 , 从 而 使 其 均值 为 0 
且 方 差 为 1. 我 们 先 考察 一 般 情 形 并 给 出 县 体 细节 , 然后 把 它 应 用 到 一 个 常见 的 分 
布 上 . 接 下 来 真正 要 做 的 是 找到 与 定义 20.4.1 中 过 程 相关 的 概率 密度 函数 . 不 妨 设 
X 是 一 个 均值 为 1 且 方 差 为 o? 的 连续 型 随机 变量 , 其 概率 密度 函数 为 fx. 于 是 


{rwar = 太 sr 一 , 矿 eoloda 三 2 


我 们 首先 寻找 一 个 均值 为 0 且 方 差 为 o? 的 随机 变量 Y. 显然 ,Y= 一 ,但 的 
概率 密度 函数 是 什么 ? 可 以 利用 累积 分 布 函数 法 来 得 出 答案 (要 回顾 该 方法 , 请 参 
阅 10.5 节 ), 因为 概率 密度 函数 就 是 累积 分 布 函数 的 导数 . 把 和 和 了 的 累积 分 布 
函数 分 别 记 作 Fx 和 Fy, 于 是 


Fy(y) = Prob(Y < vy) 
= Prob(X—n<y) 
= Prob(X <y+n) 


2 十 儿 
= fx (ja = 政 人 + 用 = 政 (Cooj = Fxty + 


求 微分 可 得 了 
fy(y) = ZX 人 十 内 面包 十 用 = jx 十 入 :1 
因此 , Y 的 概率 密度 函数 为 fy(y) = fx(y ++ 几 ). 
现在 来 验证 . 我 们 应 该 有 [>_yfy(w)dy = 0 那么 


yfy(y)dy = ls yfx(y + Hdy 


=- /ce-mmloaa 
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这 里 做 了 变量 蔡 换 , 令 zz = 二 y 十 ,那么 y =z 一 并且 dy = dz( 注 意 , 积分 上 下 限 
没有 改变 ). 回顾 一 下 fx 是 六 的 概率 密度 函数 , 并 且 X 的 均值 为 六 于 是 


viay = fx npn)de 


三 人 一 "| fx(z)dz 


=p4—4:1 = 0, 
因为 fx 是 一 个 概率 密度 函数 , 所 以 最 后 一 个 积分 值 为 1. 
怎样 让 方差 等 于 1 呢 ? 我 们 不 希望 改变 均值 , 因为 这 是 正确 的 . 所 以 , 现在 只 对 
尺度 做 重新 调整 . 对 于 任意 一 个 随机 变量 , 均 有 Var(aU) = a?Var(U), 因此 只 需要 
令 2 =Y/VVar(Y) = Y/StDev(Y)( 当 然 , 要 注意 到 StDev(Y) = StDev(X)). 接 下 
来 , 像 之 前 那样 对 累积 分 布 函数 展开 论述 , 跳 过 其 中 儿 个 步骤 (建议 你 这 样 做 ), 我 
们 得 到 


Fz(z) = Prob(Z < 2z) 
= Prob(Y < zStDev(Y)) 
= Fy (zStDev(Y)) = Fx (zStDev(X)+h) 
(因为 StDev(Y) = StDev(X)). 利用 微分 与 链 式 法 则 可 得 
jz(z) = fx (zStDev(X) +1) :StDev(X). 
ee 会 对 我 们 有 所 帮助 . 设 X 服从 [1,3] 上 的 均匀 分 布 . 
注意 , 区 间 [1,3] 上 的 概率 密度 函数 是 1/2, 否则 概率 密度 函数 就 是 0. X 的 均值 为 


2 目 方差 为 让 (x 一 2)?. 2 = 1/3( 所 以 标准 差 是 1/V 引 ， 于是, 标准 化 随机 变量 
ZH = (XX 一 /StDev(X) 的 概率 密度 函数 应 该 是 


fz(z) 一 fx (zStDev(X) 了 站 1) : StDev(X) 一 fx ( 词 十 2) 2 


也 可 以 写成 更 清晰 的 形式 
ss 
po-1| 


2V3 
0 其 他 . 


通过 快速 计算 可 得 , 这 个 函数 的 积分 值 为 1, 而 且 2 的 均值 为 0 且 方 差 为 1. 

必须 反复 强调 标准 化 一 个 随机 变量 的 重要 性 和 有 用 性 ， 接 下 来 , 我 们 还 会 再 次 
讨论 这 个 问题 . 对 于 任意 一 个 给 定 的 随机 变量 X, 把 X 变换 成 (X 一 E[X])/ 
StDev(X) 都 是 极其 自然 且 非 常 有 用 的 做 法 . 
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我 们 为 理解 标准 化 过 程 所 付出 的 努力 还 有 另外 一 个 好 处 : 这 个 过 程 说 明了 为 
什么 像 中 心 极限 定理 这 样 的 结论 能 够 成 立 ! 在 阐述 了 中 心 极 限定 理 之 后 , 我 们 会 
更 详细 地 讨论 这 个 问题 . 但 是 , 我 们 现在 开始 明白 为 什么 标准 化 下 的 随机 变量 之 和 
可 能 会 有 通用 性 质 . 原因 在 于 , 只 要 均值 和 方差 是 有 限 的 , 我 们 就 可 以 通过 单位 变 
换 让 随机 变量 的 均值 为 0 且 方 差 为 1. 从 分 布 的 矩 中 可 以 看 出 分 布 的 形状 , 这 个 观 
点 表明 了 所 有 “好 ”的 随机 变量 都 可 以 被 标准 化 , 这 样 就 使 得 变量 具有 相似 的 性 质 . 
直到 三 阶 矩 (或 者 四 阶 矩 , 此 时 三 阶 矩 为 0) 我 们 才 开 始 看 到 分 布 的 真正 “形状 ”. 中 
心 极限 定理 称 , 当 同 一 个 随机 变量 的 独立 副本 越 来 越 多 时 , 这 些 更 高 阶 的 矩 (三 阶 
以 及 更 高 阶 的 矩 ) 对 变量 和 的 分 布 的 影响 会 越 来 越 小 一 一 它们 的 主要 作用 变 成 了 控 
制 变量 和 收敛 到 正 态 分 布 的 速度 . 


20.5 “和 矩 母 函 数 的 相关 结果 


在 证 明 中 心 极限 定理 之 前 , 我 们 先 分 析 一 些 特殊 情形 , 它们 的 证 明 会 更 加 简单 . 
因为 我 们 的 假设 与 第 母 函 数 有 关 (在 19.6 节 中 讨论 过 ), 所 以 不 难 理解 需要 了 解 标 
准 正 态 分 布 的 矩 母 函 数 ， 
定理 20.5.1( 正 态 分 布 的 矩 母 函 数 ) 设 随 机 变量 X 服从 均值 为 六 且 方 差 为 a2 
的 正 态 分 布 . 它 的 矩 母 函数 是 

Mx(t) = ett 


特别 地 , 如 果 2 服从 标准 正 态 分 布 , 那么 它 的 和 矩 母 函数 就 是 


Mz(t) = et/2. 


证 明 框 架 : 虽然 可 以 尝试 直接 利用 Mx(t) = EleX] 来 求 出 Mx(t), 但 我 们 显 
然 更 愿意 计算 Mz(t) = Ele'?]. 原因 是 2 的 均值 是 0 且 方差 是 1, 这 些 数 更 加 简洁 . 
我 们 可 以 建立 关于 Mx(t) 的 方程 , 然后 做 一 些 变量 蔡 换 , 也 可 以 利用 定理 19.6.3 的 
第 二 条 性 质 从 Mz(t) 中 推导 出 Mx(t). 具体 地 说 , 我 们 有 
及 一/ 


? 


Z = 
oO 


也 就 是 
X= 0 和 十 几 

然后 使 用 Maz+e( = et Mz(ot). 

此 , 问题 简化 成 了 计算 Mz 人 ,或 者 


ot -2 /2dz 
Mz(t) = Ele'? | etz .2 5 
z0 = EE = | 


[| 
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这 个 积分 可 以 通过 完全 平方 来 计算 . 指数 部 分 的 变量 是 
22 22 = 018 22 一 2tz 十 好 一 友 (z—t)? 友 
tz 三 二 = 十 去 . 
2 2》 2 2 2 
注意 , 我 们 通过 添加 0 简化 了 代数 运算 . 这 是 一 种 强大 的 技巧 (更 多 例子 , 请 参见 


A.12 节 ). 注意 , 第 二 项 与 积分 变量 * 无 关 . 于 是 有 


Mz(t) -/ 去 ep 人 +) 


oo e-(e-t)/2qz 


2 
= 


GS V 2 
Ce 一 22 
本 ob/2 e /2du 一 et2212 
_oo V2n 


其 中 , 最 后 一 个 积分 值 等 于 1, 因为 它 是 标准 正 态 分 布 的 概率 密度 函数 在 -co 到 co 
上 的 积分 . 
中 心 极限 定理 的 主要 证 明 思 路 非常 容易 描述 . 我们 知道 标准 正 态 分 布 的 矩 母 
函数 . 对 于 独立 随机 变量 的 标准 和 , 可 以 计算 其 矩 母 函数 . 不 难 证 明 , 在 很 多 情况 
下 , 当 变 量 个 数 趋向 于 无 穷 大 时 , 最 终 的 失 母 函数 会 收敛 于 标准 正 态 分 布 的 失 母 函 
数 . 接 下 来 只 需要 说 明 , 如 果 两 个 概率 密度 函数 具有 相同 的 算 母 函数 , 那么 它们 是 
相等 的 ; 或 者 更 一 般 地 , 如 果 一 个 算 母 函数 列 收敛 于 标准 正 态 分 布 的 和 矩 母 函数 , 那 
么 其 概率 密度 函数 也 必须 收敛 于 标准 正 态 分 布 的 概率 密度 函数 . 不 笠 的 是 , 这 个 结 
果 并 不 是 始终 成 立 的 一 一 参见 例 19.6.6. 
幸运 的 是 , 现在 还 有 希望 挽救 这 种 状况 . 我 们 需要 一 些 技术 条 件 来 确保 不 会 发 
生 这 种 情况 . 换 种 自然 的 说 法 , 失 母 函数 的 收敛 性 意味 着 相应 概率 密度 函数 的 收敛 
性 . 如 果 多 给 出 一 些 有 关 分 布 的 假设 , 那么 诸如 例 19.6.6 的 危险 就 会 消失 . 

毫 不 意外 的 是 , 解决 这 些 技术 性 问题 超出 了 概率 论 入 门 课 的 范围 . 我 们 确实 要 
利用 复 分 析 或 傅 里 叶 分 析 中 的 结果 . 对 于 那些 感 兴 趣 的 读者 , 我 们 将 在 第 21 章 中 
勾勒 出 主要 思想 . 如 果 你 想 了 解 更 多 , 请 参阅 在 线 补 充 章 节 “ 复 分 析 与 中 心 极 限定 
里 ”现在 , 我 们 只 简单 地 陈述 两 个 黑 盒 结 果 , 你 可 以 放心 地 自由 使 用 . 这 些 结果 会 
涉及 累积 分 布 函数 , 因此 为 了 保持 完整 性 , 我 们 首先 回顾 一 下 这 个 定义 . 


YH 


定义 20.5.2 ” 设 Fx 和 Gy 分 别 是 随机 变量 X 和 YY 的 累积 分 布 函数 (CDF)， 
其 中 X 和 了 的 概率 密度 函数 分 别 是 f 和 g. 那么 


Fx(7) | f(t)dt 
cr = 人 di 
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复 分 析 (尤其 是 拉 普 拉 斯 公式 与 傅 里 叶 反 演 公 式 ) 给 出 了 以 下 两 个 非常 重要 且 
有 用 的 定理 , 用 来 确定 什么 时 候 可 以 矩 用 唯一 地 确定 概率 密度 函数 . 


定理 20.5.3 ” 设 矩 母 函 数 Mx(j 和 My(t) 在 0 附近 的 一 个 邻 域内 存在 ( 即 存 
在 一 个 6, 使 得 当 |t| < 6 a 如 果 在 这 个 邻 域 内 有 Mx(t) = 
My(t), 那么 对 于 所 有 的 _ 均 有 Fx(u) = Fy(w). 因为 概率 密度 函数 是 累积 分 布 
函数 的 导数 , 所 以 上 = g. 


定理 20.5.4 设 {Xijier 是 一 个 随机 变量 序列 , 它们 的 甜 母 函 数 是 Mx,(t). 假 
设 存在 一 个 6 > 0, 使 得 当 四 < 5 时 有 limni so Mxi(t) = Mx(t), 其 中 Mx(t) 是 
一 个 算 母 函数 . 另外 , 当 |t| < 8 时 , 所 有 具 母 函数 均 收 敛 . 那么 存在 唯一 的 累积 
分 布 函 数 卫 ， 使 得 五 的 矩 均 由 Mx(t) 给 出 , 而 且 对 于 Fx (zx) 的 任意 一 个 连续 点 
Zz) 均 有 lim so Fx,(7) = Fx (zx). 
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为 了 证 明 一 般 情 形 下 的 中 心 极 限定 理 ， 0 明 服 从 泊 松 分 布 的 随机 变量 
的 标准 和 将 收敛 于 标准 正 态 分 布 . 这 个 过 程 包含 了 证 明 一 般 情形 的 关键 思想 , 而 且 
涉及 和 矩 母 函数 . 由 定理 20.5.1 可 知 , 标准 Rs ef /2. 在 例 19.6.4 
中 , 对 于 服从 泊 松 分 布 且 均 值 为 的 随机 变量 X, 我 们 求 出 了 它 的 条 母 函数 , 即 


Mx(t) = 1+ yt1 和 下 

注意 , X 的 均值 和 方差 都 等 于 和 ， 为 了 看 出 这 一 点 , 我 们 对 矩 母 函数 求 微分 , 并 让 
t 二 0. 记 住 , 矩 母 函 数 的 展开 式 中 包含 了 非 中 心 矩 (一 阶 矩 、 二 阶 矩 , 等 等 ) 虽然 均 
值 是 一 阶 矩 , 但 方差 不 是 二 阶 窍 (除非 均值 恰好 为 0). 一 般 情 况 下 , 方差 是 二 阶 甜 
减 去 均值 的 平方 . 于 是 


dMx t 
Ps Net .ANX(e = | 三 沪 
四 dt li=0 ( i t=0 
， d2 Mx 
12 dt2 li=0 


= (et .ex(e -0D 十 M2e2t | | = 入 + 和. 
t=0 


02 = EX = ELXY]— ELX], 


所 以 
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男 外 , 利用 矩 母 函数 的 泰勒 展开 式 , 也 可 以 求 出 均值 和 方差 . 我 们 有 


Te Ce | Ce 1))3 
虽然 这 个 式 子 乍 一 看 非常 复杂 , 但 我 们 注意 到 et 一 1 的 泰勒 展开 式 为 二 如 /2! 二 … = 
t(1 十 4/2 十 .…), 也 就 是 说 (et 一 1)* 可 以 被 ww 整除 . 这 表明 了 


t + 2 
eX = 1+ ) 2 ) 


21 
33 +t/2 + 
T 3! T 
2 t a 
=1 +A HF 入 十 太 及 更 高 次 项 
2 了 人 
人 J 并 


因此 , 根据 已 知 的 es 的 泰勒 级 数 展开 式 , 我 们 可 以 通过 代数 运算 求 出 前 两 阶 矩 , 而 
不 必 求 微分 . 我 们 让 读者 自己 来 决定 更 喜欢 哪 种 方法 (或 者 不 太 讨 厌 哪 种 方法 ). 


定理 20.6.1 设 Xi,:… ,XN 是 相互 独立 的 随机 变量 , 它们 均 服 从 参数 为 入 的 
泊 松 分 布 . 令 

XI 十 … 十 XN 

全 

当 N 一 co 时 , 了 Ny 会 收敛 于 均值 为 入 且 方 差 为 入 的 正 态 分 布 . 


XN = 


证 明 : 我 们 期 望 Xv 近似 于 泊 松 分 布 的 均值 , 此 时 即 为 这 一 点 可 以 利用 
期 望 值 的 线性 性 质 得 出 : 


N 
K++Xy| 1 = 和 
[又 v] = | 元 x [X] = 元:NA = 入 


把 均值 记 作 y( 而 不 是 入), 这 样 可 以 使 参数 更 一 般 化 , 那么 最 终 的 计算 结果 也 会 
接近 于 一 般 情况 . 

用 o? 表示 X( 服 从 参数 为 和 的 泊 松 分 布 ) 的 方差 . 我 们 知道 o = VA, 但 接 下 
来 我 们 仍然 将 其 写作 o, 因为 这 样 会 使 计算 看 起 来 更 一 般 化 . XN 的 方差 可 以 类 似 
地 计算 . 因为 X% 是 相互 独立 的 , 所 以 


N 
Ea X11 十 :… 十 XN 1 1 o2 
Var(XN) = var ( ) = We 2 Ve) 二 Na N° = 


和 往常 一 样 , 我 们 自然 想到 考 绎 下 面 这 个 量 


XN > [又 N] lt tN 


ZN = 


一 内 (XI 二 十 XN) 一 VH 
StDev(XN) o/VN ovVN | 
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接 下 来 , 利用 
Maxta(t) = eMx(t/b) 

以 及 “独立 随机 变量 之 和 的 矩 母 函数 等 于 矩 母 函数 的 乘积 (定理 19.6.3) 这 一 事实 ， 
可 以 求 出 Zw 的 和 窍 母 函 数 , 于 是 有 


AIzw (t) = M(xit. tx NA (t) 
ovVN 


-可 。 浇 A( ’ 2 (20.2) 


在 最 后 一 步 中 , 我 们 利用 了 已 知 矩 母 沙 数 Mx(t) 的 表达 式 这 一 优势 . 现在 把 指数 
函数 进行 泰勒 展开 , 即 


4 | CN 
057 1 2 al 


这 是 世界 上 最 重要 的 泰勒 展开 式 之 一 . 因为 中 心 极限 定理 涉及 高 斯 分 布 , 而 高 斯 分 

布 又 与 指数 函数 有 关 , 所 以 这 个 泰勒 级 数 的 出 现 应 该 不 足 为 奇 

因此 , 式 (20.2) 中 的 指数 部 分 就 是 
让 过 RR 

ovVN 202N 603nVN 

需要 注意 的 是 , 当 上 式 减 去 + 时, 第 一 项 就 变 成 了 i， 余部 分 

Wes 来 确定 . 因此 , 其 余 所 有 项 最 多 等 价 于 

某 个 党 对 于 较 大 的 mw 这 些 项 可 以 忽略 不 计 , 我 们 把 这 样 的 误差 记 作 

0 (5 sk 这 就 是 所 请 的 大 O 表示 法 下 面 给 出 它 的 技术 定义 , 相关 例子 请 参阅 

习题 20.11.36. 


大 O 表示 法 : f(x) = O(g(z))( 读 作 : f(x) 是 g(x) 的 大 0) 意味 着 存在 常数 C 和 
zo, 使 得 只 要 z > zo, 就 有 |f(z)| < Cg(z). 换 句 话说 , 从 某 个 点 开始 , |f(z)| 由 常 
数 与 g(z) 的 乘积 来 确定 . 


因此 , 回忆 一 下 , 当 随机 变量 服从 泊 松 分 布 时 ,/ 二 入 且 o2 = 和. 式 (20.2) 就 变 
成 了 


有人 全 
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N 3 t3 
Mznlt) = Te (m+ an +o( nm)) 
wy pt2 £3 
一 II @202N 二) 
商 二 油 
-ot0( 痪 
能 够 得 到 最 后 一 行 是 因为 这 是 N 个 完全 相同 的 项 的 乘积 . 于 是 , 对 于 所 有 的 t， 当 
六 一 co 时 , Zw 的 矩 母 函 数 趋向 于 ef /2 而 这 恰好 是 标准 正 态 分 布 的 矩 母 函 数 . 为 
了 完成 证 明 , 我 们 需要 利用 定理 20.5.4. 这 是 从 复 分 析 中 得 到 的 黑 盒 结 果 之 一 , 它 
指出 如 果 一 个 矩 母 函数 列 在 |t| < 6 时 均 存 在 , 并 且 该 函 数列 收 化 于 某 个 概率 密度 


函数 的 矩 母 轴 数 , 那么 相应 


例子 中 , Zw 会 收敛 于 标准 正 态 分 布 . 
只 要 把 矩 母 函数 的 泰勒 级 数 展开 到 足够 多 项 , 就 可 以 得 到 
时 , 这 些 项 的 极限 值 是 有 限 的 ), 然后 再 
趋向 于 0). 如 果 把 泰勒 级 数 进 
明 更 多 . 除了 证 明 收 敛 于 标准 正 态 分布 外 , 我 们 还 会 得 至 
然 这 是 种 特殊 情形 , 但 我 们 可 以 看 到 一 般 情形 下 的 某 些 特征 . 
看 起 来 似乎 并 不 重要 , 我 们 只 用 到 了 X 的 一 阶 矩 和 二 阶 矩 . 然而 高 阶 和 矩 其 
要 , 它们 的 作用 是 控制 收敛 到 标准 


估算 误差 项 的 大 小 ( 当 NN 一 co 时 , 误差 项 
步 展 开 , 并 对 误差 项 做 更 仔细 的 考察 , 那么 还 能 证 


E 态 分 布 的 速度 . 这 体现 在 e24 /YN) 中 . 


的 概率 密度 函数 就 会 收敛 于 这 个 概率 密度 函数 . 在 这 个 


A 一 oo 


j 主 要 的 项 ( 当 


到 收敛 速度 的 相关 结果 . 虽 


注意 ,分 布 的 高 阶 和 矩 
实 很 重 


20.7 利用 MGF 证 明 一 般 的 CLT 


我 人 


不 错 的 主意 . 


比较 容易 , 之 后 你 会 发 现在 一 
定理 20.2.2 的 证 明 (中 心 极限 定理 ) 看 看 定型 


一 行 之 前 , 我 们 的 六 
换 成 了 泊 松 分 布 的 多 


] 故 意 让 定理 20.6.1( 
会 收敛 于 标准 正 态 分 布 ) 的 证 
极限 定理 的 完整 版 本 . 在 证 明 一 个 较 难 


明 尽 量 # 


即 相互 独立 且 同 


也 一 


股 化 ] 


这 样 可 以 让 你 对 问题 有 个 直观 的 了 解 . 通 徊 


让 说 ， 


人 双 述 适用 于 人 


布 的 随机 变量 . 人 


是 , 现在 


E 坪 函数 表达 式 , 这 是 


们 不 知道 M; 是 


Mzn (t) a 


什么 . 


于 是 有 


N 2 1 
ecv AI 
Le Mx (I 


因为 我 们 考察 的 是 


分 布 于 泊 松 分 布 的 随机 变量 的 标准 
日 尽 可 能 长 , 以 便 将 其 用 于 证 明 中 心 
的 结论 之 前 , 先 试 着 证 明 一 些 特殊 情形 是 个 
情况 下 , 考察 具体 的 例子 
般 情况 下 什么 是 重要 的 或 有 用 的 . 

EE 20.6.1 的 证 明 , 在 式 (20.2) 的 最 后 
F 意 一 种 分 布 . 在 最 后 一 行 , 我 们 把 Mx(t/oVN) 替 


和 


日 互 独立 


日 服从 泊 松 分 


不 能 把 Mx(t/oVN) 替换 成 某 个 具体 的 展开 式 , 因为 我 


(20.3) 
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(因为 随机 变量 是 同 分 布 的 ). 

为 了 完成 证 明 , 可 以 利用 好 几 种 方法 来 解决 代数 运算 . 我 们 选择 下 列 方法 的 原 
因 是 , 它 强调 了 数学 中 最 重要 的 技巧 之 一 : 每 当 看 到 乘积 时 , 你 都 应 该 认真 考虑 把 
它 替换 成 一 个 和 . 这 样 做 是 因为 我 们 有 很 多 求 和 经 验 . 我 们 有 计算 特殊 和 的 公式 ， 
也 可 以 利用 泰勒 级 数 把 一 个 好 函数 展开 成 一 个 和 . 对 于 乘积 , 我 们 了 解 的 并 不 多 , 也 
不 清楚 该 如 何 把 一 个 函数 展开 成 乘积 形式 . 

如 何 将 一 个 乘积 转化 为 一 个 和 ? 我 们 知道 , 乘积 的 对 数 是 对 数 的 和 . 因此 , 对 
式 (20.3) 取 对 数 . 当 完 成 分 析 后 , 再 对 该 式 取 指 数 . 我 们 有 

se es 2 ON (2%) . (20.4) 
注意 , 在 上 面 的 展开 式 中 , 对 于 固定 的 t, 第 一 项 的 大 小 取决 于 VN. 如 果 它 不 能 被 
另外 某 项 抵消 , 那么 极限 是 不 存在 的 . 幸运 的 是 , 它 被 抵消 了 , 而 我 们 只 关心 1/N 
之 前 的 项 . 关注 这 么 小 的 项 是 因为 我 们 要 乘 以 N. 然而 , 1/N3/2 或 更 小 的 项 不 会 在 
极限 中 发 挥 作用 , 因为 它们 乘 以 V 之 后 仍然 很 小 . 
我 们 有 


Mt 
Mx(t) = Tr 一 1+t(n+ 学 +.…) 


现在 利用 log(1 + w) 的 泰勒 级 数 展开 式 , 即 
人 


log(1 + vu) = We 


i 
把 上 面 的 两 个 式 子 结合 起 来 可 得 


区 
9 KH2t 
,4 t (w+ +…】 


/一 人 
一 /好 十 Eee 十 如 或 更 高 次 项 . 


i SR 
log Mx (t) = t+ 或 更 高 次 项 . 


但 我 们 想 求 的 是 Mx 在 tJoVN 处 的 值 , 而 不 是 在 t 处 的 值 . 于 是 


log Mx (= 上 二 用 - 万 志 |pB/N3/2 项 或 N 的 次 数 更 低 的 项 
ovVN ovVN | 2 o2N | VS > 


因此 , 我 们 把 六 的 次 数 更 低 的 项 记 作 O(N-3/2). 当 乘 以 N 之 后 , 它们 就 变 成 了 新 
的 误差 项 OUN-12). 
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所 有 这 些 的 要 点 是 简化 式 (20.4), 即 log Mzn(t) 的 展开 式 . 综 上 所 述 可 得 


二 LtVN nt Hp i 一 3/2 

log Mzn(t) = (7 | 7 a O(N 一) 
2 /2 
0o Oo 2 0o2 


12 
= 可 十 O(N-1/2). 


最 后 一 步 为 什么 是 正确 的 ? 上 式 中 及 一 jy2, 它 等 于 E[X?] 一 正 [X]2, 而 这 正 是 方 
差 的 另 一 种 定义 . 所 以 , jw 一 p22 = 02. 
因此 , 如 果 log Mz (t) 形 如 如 /2 十 O(N-1/2), 那么 


Mgnlt) = 时 +O 


虽然 我 们 采用 了 不 同 的 方法 , 但 最 终 的 结论 与 定理 20.6.1 的 证 明 是 一 致 的 . 这 里 再 
次 利用 了 定理 20.5.4, 它 是 从 复 分 析 中 得 到 的 黑 盒 结果 之 一 . 它 指 出 如 果 一 个 矩 母 
函数 列 在 |t| < 5 时 均 存在 , 并 且 该 函数 列 收 伊 于 某 个 概率 密度 函数 的 矩 母 函数 , 那 
么 相应 的 概率 密度 函数 就 会 收敛 于 这 个 概率 密度 函数 .在 这 个 例子 中 , Zw 会 收 人 
于 标准 正 态 分 布 

在 上 述 证 明 中 , 当 抛 弃 如 及 更 高 次 项 时 , 必须 要 小 心 . 此 时 , 我 们 利用 矩 母 函 
数 在 | < 5 时 会 收敛 这 一 假设 来 说 明 佐 不 会 过 快 地 增长 , 从 而 使 得 这 些 项 在 极限 
中 不 会 发 挥 作用 . 更 严格 的 论述 , 请 参阅 习题 20.11.7. 
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大 多 数 概率 论 教材 (至 少 是 老 教材 ) 都 有 标准 正 态 分 布 表 . 举 个 例子 , 假设 我 们 
想 计算 服从 标准 正 态 分 布 的 随机 变量 与 0 之 间 相 差 1 个 标准 差 的 概率 , 只 需要 翻 
到 书 的 最 后 , 从 表 中 找 出 结果 即 可 . 但 是 , 你 不 太 可 能 找到 哪 本 书 会 给 出 均值 为 V2 
是 方 莽 为 x 的 正 态 分 布 的 概率 值 . 

为 什么 不 存在 这 样 的 表格 ? 有 两 方面 的 原因 . 当然 , 首先 是 计算 机 非常 强大 且 
易于 使 用 , 使 得 对 上 述 表 格 的 需求 大 大 减少 , 因为 几 行 代码 就 能 给 出 答案 . 在 今天 看 
来 , 这 可 能 是 一 个 令 人 满意 的 答案 , 但 是 电脑 出 现 之 前 为 什么 没有 这 样 的 表格 呢 ? 
上 一 个 例子 可 能 有 些 荒 诬 , 但 如 果 是 均值 为 3 且 方 差 为 4 的 正 态 分 布 呢 ? 肯定 有 人 
研究 过 这 个 分 布 . 

不 需要 这 种 表格 的 原因 是 , 如 果 知 道 了 标准 正 态 分 布 的 概率 , 我 们 就 可 以 用 其 
来 计算 任意 正 态 分 布 所 对 应 的 概率 . 为 了 更 加 具体 , 假设 W ~ N(3,4), 这 意味 着 WW 
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的 均值 为 3、 方 差 为 4( 或 标准 差 为 2). 不 妨 设 我 们 想 求 出 W e [2, 10] 的 概率 . 利用 


_W-EW]) W-3 
StDev(W) 2 Ons) 
对 W 标准 化 (参见 定义 20.4.1). 因此 , 问 W & [2,10] 的 概率 就 等 价 于 问 2 属于 某 
个 特定 区 间 的 概率 . 是 哪个 区 间 呢 ? W & [2, 10] 与 2 e [1/2,7/2] 是 一 样 的 . 如 果 
有 一 个 标准 正 态 分 布 的 概率 表 , 我 们 就 能 求 出 这 个 概率 , 从 而 得 到 W s [2,10] 的 概 


这 大 棒 了 ! 我 们 只 有 一 个 正 态 分 布 的 概率 表 , 但 通过 简单 的 代数 运算 就 可 以 推 
出 其 他 任意 一 个 正 态 分 布 的 相应 概率 . 在 计算 机 出 现 之 前 , 这 是 一 种 非常 重要 的 方 
法 . 这 意味 着 人 们 只 需要 计算 一 个 概率 表 就 可 以 研究 所 有 的 正 态 分 布 . 

这 与 对 数 表 非常 相似 . 大 多 数 教材 只 有 以 e 为 底 的 对 数 表 (有 时 以 10 为 底 , 或 
者 以 2 为 底 ). 通过 类 似 的 标准 化 过 程 , 如 果 有 一 个 以 某 数 为 底 的 对 数 表 , 那么 就 能 
算出 以 任何 一 个 数 为 底 的 对 数值 . 这 是 基于 下 面 的 对 数 定律 (通常 称 为 换 底 公式 ): 
对 于 任意 的 b,c,x > 0, 我 们 有 


]ogp x 


leg 二 
logp c 


昌 然 这 个 对 数 定律 可 能 最 容易 被 遗忘, 但 它 非常 有 用 , 值得 人 们 记 住 . 假设 已 知 以 
b 为 底 的 对 数 表 , 那么 利用 公式 右 端的 表达 式 , 可 以 计算 以 c 为 底 的 任意 一 个 z 的 
对 数值 . 因此 , 只 编制 一 个 对 数 表 就 足够 了 (因为 以 e 为 底 和 以 10 为 底 都 很 常用 ， 
所 以 给 出 两 个 表 很 棒 , 但 只 有 一 个 也 足够 了 ). 
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积分 学 最 大 的 谎言 之 一 就 是 你 可 以 求 出 积分 . 具体 地 说 , 这 是 指 对 于 一 个 给 定 
的 函数 , 你 能 为 其 原 函 数 找到 一 个 漂亮 的 解析 表达 式 . 可 悲 的 是 , 一 般 情 况 下 , 这 是 
不 可 能 的 . 例如 , 虽然 e-” 是 概率 论 中 最 重要 的 函数 之 一 , 但 为 了 计算 它 的 积分 ， 
我 们 不 得 不 借助 无 穷 级 数 展开 ( 称 为 误差 函数 , 14.4 节 给 出 了 描述 ). 内 行 也 必须 非 
向 努力 地 构造 出 具有 良好 积分 的 函数 . 
本 节 涉 及 中 心 极 限定 理 最 重要 的 应 用 之 一 : 蒙特 卡 罗 法 . 很 多 人 都 说 这 是 20 
世纪 最 伟大 的 数学 成 就 , 如 此 断言 显然 需要 一 些 证 据 来 文 持 ， 人 们 为 什么 会 这 人 么 
说 ? 它 能 让 你 准确 而 快速 地 模拟 相当 复杂 的 现象 , 尤其 是 以 极 高 的 精度 确定 高 维 积 
分 . 它 最 早 的 用 途 之 一 是 试图 了 解 如 何 制 造 原子 弹 , 以 及 处 理 极 其 复杂 的 相互 作用 . 
这 样 的 应 用 一 直 持 续 到 今天 . 例如 , 经 济 学 中 的 大 部 分 积分 都 不 能 用 解析 表达 式 来 
述 , 而 必须 进行 模拟 . 


| 
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我 们 先 来 描述 一 下 这 种 方法 , 然后 看 看 它 为 什么 有 上 
并 且 有 一 个 区 域 完 全 包含 在 其 中 , 不 妨 把 这 个 区 域 记 作 4. 假设 我 们 可 以 轻松 地 确 


]. 假设 有 一 个 单位 正方 形 ， 


定 一 个 点 (z,y) 是 否 属于 4. 例如 , 可 能 存在 一 些 好 的 函数 f 和 g, 使 得 


A= {(z,y) :f(r) <y < g(x), 0 入 zz 所 1 


那么 
1 
只 (A) = 7T)— 
面积 (4) | el) f(z) 
不 幸 的 是 , 计算 这 个 值 需要 求 出 原 函 数 ! 


这 个 思路 非常 简单 , 却 很 强大 . 假设 我 们 可 以 从 单 


位 正方 形 中 均匀 地 随机 取 点 . 


当 取 出 了 大 量 点 时 , 比如 取出 了 NN 个 点 , 4 的 面积 应 该 非常 接近 于 落 在 4 区 域 中 


的 点 所 占 的 比例 . 这 通常 被 有 趣 地 描述 为 向 把 子 投掷 飞镖 , 并 考察 命中 的 比例 (我 
们 假设 所 有 飞镖 都 落 在 单位 正方 形 内 , 否则 就 忽略 这 文 飞 镖 , 然后 重新 投 扼 ). 因此 ， 


如 果 我 们 投掷 了 次 飞镖 , 那么 


落 在 4 区 域 的 飞镖 个 数 


N 


当然 , 如 果 4 包含 在 一 个 2 x 3 的 矩形 中 , 那么 为 了 求 吕 


的 缩放 调整 . 当 4 包含 在 某 区 域 R 中 时 , 有 


沙 在 4 区 域 的 飞镖 个 数 
N 


我 们 用 = 表示 约 等 于 ， 这 个 近似 有 多 好 ? 现在 ， 


面积 (A) 3 


x 面积 (R). 


4 的 面积 , 必须 进 


~ 
器 
荆 


中 心 极限 定理 就 要 发 挥 作 用 


了 . 为 了 简单 起 见 , 不 妨 设 R 是 一 个 单位 正方 形 . 忆 


oe sy 


4 中 的 概率 就 等 于 面积 (4). 这 N 个 点 是 独立 取 H 


bh 么 , 随机 取出 的 一 个 点 落 在 
的 , 因此 如 果 当 第 i 个 点 落 在 


4 中 时 令 X; = 1、 否 则 X; = 0, 那么 我 们 就 得 到 了 相互 独立 且 服 从 同一 个 伯 努 


利 分 布 的 N 个 随机 变量 , 其 中 成 功 的 概率 为 p = 面积 (4)， 于是, 1 


中 心 极 限定 


理 可 知 , 当 一 ce 时 , (Xi 十 … 十 XN)/N 收敛 了 


均值 为 面积 (4) 


V 面积 (4)(1 一 面积 (4A)N-1/2 的 正 态 分 布 . 这 太 神 奇 了 


么 这 个 面积 的 误差 就 是 1/1000. 我 们 给 出 一 个 例子 , 如 图 20-1 所 示 . 
虽然 我 们 早 就 知道 圆 的 面积 公式 , 但 这 个 例子 很 好 地 阐述 了 这 种 方法 . 只 要 我 


们 能 轻松 地 生成 随机 点 , 并 且 可 以 确定 它们 是 否 落 在 
面积 . 请 注意 , 这 种 方法 不 局 限于 二 维 空间 , 所 以 对 于 
金融 模型 中 出 现 ), 这 种 方法 也 是 可 行 的 . 


300 多 个 维度 的 


: 如 果 和 N 大 约 是 100 万 , 那 


目标 区 域内 , 就 能 很 好 地 估算 


且 标准 差 为 


区 域 (在 茶 坚 
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numdo 一 一 已 numdo 一 一 上 日 


[oo -ll+| ls| 了 | [zs 二 lt| aly| -| 


3.224 3.14027 


Q:r 


.和 1.0 [ 和 > 


图 20-1 单位 圆 面积 的 蒙特 卡 罗 模 拟 : ( 左 图 )1000 个 点 ， 估计 值 为 3.224; ( 右 图 )7500 个 点 ， 


本 章 得 到 了 一 个 极 好 的 概率 证 明 , 即 全 面 地 讨论 了 为 什么 中 心 极限 定理 是 正确 


估计 值 3.140 27. 真实 值 为 rs 3.141 59 


20.10 总 结 


的 . 数学 家 们 不 会 随意 地 删 减 修饰 语 . 一 个 定理 需要 特别 重要 才能 被 指定 为 基本 的 . 


到 目前 为 止 , 你 可 能 已 经 看 到 了 三 个 基本 定理 . 


算术 基本 定理 . 任何 大 于 1 的 正 整数 都 可 以 唯一 地 写成 若干 素数 的 乘积 ( 当 
然 , 要 重新 排列 因子 的 次 序 ). 这 个 定理 为 什么 如 此 重要 ? 它 意味 着 素数 是 构 
成 整数 的 基本 要 素 , 就 像 在 化 学 中 原子 是 构成 分 子 的 基本 要 素 一 样 . 它 也 是 
许多 密码 学 成 果 的 基础 , 是 数论 中 为 素数 建立 一 个 有 用 表示 的 起 点 ( 歼 曼 5 
函数 ). 

代数 基本 定理 . 如 果 f(z) 是 一 个 n 次 复 系数 多 项 式 , 那么 f 恰好 及 n 个 复 
根 ( 重 根 按 重 数 计算 ). ( 记 住 , 复数 都 是 形 如 z = z 十 万 的 数 , 其 中 i= V1， 
2 和 yy 都 是 实数 . ) 这 个 结果 对 于 我 们 理解 函数 和 数 至 关 重要 . 注意 , 整 系 
数 多 项 式 不 一 定 有 整数 根 (f(x) = 2z 一 3 以 3/2 为 根 ), 而 实 系 数 多 项 式 不 
一 定 有 实数 根 (f(x) = x? 十 1 以 i= V=I 为 根 ), 但 是 一 旦 考虑 了 V1( 求 
解 zz+1=0 可 得 ), 我 们 就 不 需要 补充 任何 条 件 ! 对 于 任意 的 三 次 、 四 次 、 
五 次 等 方程 , 不 需要 添加 任何 条 件 就 可 以 求 出 方程 的 根 ! 事实 上 , 多 项 式 迭 
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(而 且 这 些 条 件 可 以 通过 做 更 多 工作 来 进一步 削弱 ), 这 能 确保 该 定理 适用 于 各 种 情 
况 . 
以 矩 母 函数 为 基础 , 我 们 讨论 了 中 心 极限 定理 的 证 明 . 阿 基 米 德 说 :“ 给 我 一 个 


代 (给 定 一 点 x 和 多 项 式 f, 考察 序列 x、f(z) 


~、 (f(z))、fA(A(f(2))), 等 等 ) 


可 以 对 许多 现象 进行 很 好 的 模拟 , 并 在 混沌 理论 和 分 形 几 何 中 不 断 出 现 . 这 
些 理论 被 用 于 各 种 领域 , 比如 电影 的 现实 特效 以 及 股票 市 场 的 强大 模型 . 


微 积 分 基本 定理 (FTC). 在 8.1 节 中 , 我 们 讨 


论 过 下 面 这 个 问题 如 果 FF 


是 f 的 原 函 数 ( 即 F(x) = f(x)), 那么 曲线 y= f(z) 下 方 介 于 a 和 "之 间 


的 区 域 面积 是 F(b) -F(a). 这 是 我 们 开始 理解 连续 型 随机 变量 的 概率 的 起 


点 . 这 些 概率 可 以 被 解释 为 曲线 下 方 区 域 的 面 
种 求解 它们 的 好 方法 . 


避 , 而 FTC 为 我 们 提供 了 一 


现在 , 我 们 把 中 心 极限 定理 (CLT) 添加 到 这 个 列表 中 . 虽然 并 没有 把 它 称 作 
“基本 ”定理 , 而 是 称 为 “中 心 ” 定 理 , 但 其 思想 是 一 样 的 . 它 需要 的 条 件 相 当 薄 弱 


足够 长 的 杠 杜 和 一 个 支点 , 我 可 以 播 起 地 球 . ”对 我 们 
以 推动 整个 主题 . 生成 函数 完美 地 引入 了 CLT. 另外 ， 


种 享受 . 生成 函数 法 强调 了 为 什 和 


来 说 , 生成 函数 是 杠杆 , 它 可 
即便 是 浏览 证 明 方 法 也 是 一 


只 有 前 两 阶 矩 很 重要 . 正如 我 们 所 看 到 的 , 任何 


一 个 好 的 概率 密度 函数 都 可 以 被 标准 化 为 均值 为 0 且 方 差 为 1. 因此 , 如 果 只 有 前 


两 阶 矩 是 重要 的 , 而 且 前 两 阶 矩 总 能 取 作 0 和 1, 那么 我 们 肯定 会 期 望 有 某 些 通用 


EE 


E 质 ! 


最 后 , 我 们 再 给 出 一 点 说 明 . 阿 基 米 德 的 话 有 两 个 假设 : 除了 需要 一 个 杠杆 外 ， 
他 还 要 求 一 个 支点 . 我 们 很 容易 忘记 这 一 点 , 但 这 是 不 应 该 的 . 我 们 需要 记 住 为 什 
么 生成 函数 法 会 如 此 有 效 . 在 很 大 程度 上 , 这 是 因为 它 建立 在 一 个 漂亮 而 强大 的 传 
里 叶 分 析 或 复 分 析 的 理论 基础 之 上 . 我 们 需要 这 些 领 


Ul 


数 中 推导 出 相应 的 概率 密度 函数 会 收敛 于 标准 


域 中 的 一 些 重 要 结果 来 完成 


证 明 . 如 果 没 有 这 些 结果 , 就 无 法 从 矩 母 函数 列 的 极限 等 于 标准 正 态 分 布 的 矩 母 函 


FE 态 分 布 的 概率 密度 函数 ， 这 些 基 


本 内 容 (在 概率 论 和 其 他 领域 中 ) 非常 重要 , 我 们 将 在 第 21 章 中 详细 讨论 ( 想 了 解 
更 多 内 容 , 请 参阅 在 线 补充 章节 “ 复 分 析 与 中 心 极限 定理 ”). 


习题 20.11.1 ” 设 f 和 g 是 两 个 连续 函数 , 并 且 只 要 h(x) 在 某 个 长 度 为 1 的 区 间 上 恒 等 于 


20.11 习 题 


一 个 常数 , 就 有 


人 : i ja jzjg(zjdz， 


定 有 = 9 吗 ? 如 果 不 是 , 那么 能 否 推出 f 和 9 之 间 


的 茶 些 共同 性 质 ? 
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习题 20.11.2 


在 20.1 节 中 , 我 们 曾 


f(0)=1 


9(0) = 一 1. 证 明 我 从 


i 


提 到 过 ， 


了 (0) 去 9(0) 时 ,可 以 不 失 一 般 性 地 假设 


] 可 以 做 这 样 的 变换 . 


习题 20.11.3 ”在 20.1 节 中 , 我 们 使 用 了 一 个 不 连续 的 阶梯 函数 h,， 如 果 只 知道 当 h 连续 
时 , 式 (20.1) 中 的 积分 是 相等 的 , 那么 此 时 结果 会 发 生 什么 改变 ? 把 修改 成 一 个 连续 
习题 20.11.4 考虑 下 面 的 三 角形 概率 密度 函数 
nn|z—2/nl 若 1/n<z<3/n 
fn(7) = | 
0 他 ，; 
对 于 任意 一 个 mw f(z) 都 是 非 负 的 且 其 积分 值 等 于 1, 所 以 f(x) 确实 是 概率 密度 函数 . 
证 明 : 即使 所 有 函数 都 是 连续 的 , 仍 有 
im fn(z)dx # 人 im 万 (z)dz. 
这 里 的 困难 类 似 于 多 元 微 积分 的 富 比 尼 定理 一 一 其 问题 在 于 , 函数 fi 并 不 是 一 致 有 界 
的 . 
习题 20.11.5 ”证 明 : 对 于 任意 的 > 0, 有 (logx) = O(z) 和 xz7 = O(e”). 
习题 20.11.6 ” 设 > > 0. wx" = O(exp(Vlogz)) 是 否 成 立 ? 证 明 你 的 结论 . 
习题 20.11.7 ”在 证 明 中 心 极限 定理 时 , 我 们 考察 了 log Mx (t/ovVN) 的 级 数 展开 式 (其 中 ， 
X 的 和 矩 母 函 数 在 |t| < 5 时 收敛 ) 并 且 只 讨论 到 t 的 平方 项 . 关于 这 一 点 ,给 出 严格 的 
证 明 . 如 果 愿 意 的 话 , 你 可 以 为 这 些 矩 添加 一 些 较 强 的 假设 , 例如 存在 某 个 。 > 0 使 得 
I = O(nt—e). 
习题 20.11.8 ” 设 随机 变量 X 服从 参数 为 和 的 指数 分 布 , 2 是 X 的 标准 化 形式 . 求 出 2 的 
习题 20.11.9 ” 设 随机 变量 X 服从 参数 为 和 的 泊 松 分 布 , 2 是 X 的 标准 化 形式 . 求 出 2 的 
习题 20.11.10 ”不 使 用 一 般 情形 下 的 论述 , 对 服从 指数 分 布 的 随机 变量 之 和 , 证 明 CLT. 
习题 20.11.11 ”假设 有 N 个 随机 变量 服从 同一 个 指数 分 布 ， 有 N 个 随机 变量 服从 同一 
个 几何 分 布 ， 而 且 这 些 变 量 都 是 相互 独立 的 . 证明: 当 趋向 于 无 穷 大 时 ， 
恒 二 Xat+…+XNt 玖 二 + 十 Yo 收敛 于 一 个 正 态 分 布 . 
习题 20.11.12 ”在 上 一 题 中 , 正 态 分 布 的 均值 和 方差 分 别 是 多 少 ? 如 何 把 它 标 准 化 ? 


习题 20.11.13 
量 月 
回 导 
对 最 终 的 结果 产生 影 
习题 20.11.14 ”在 习题 2 


向 ? 
0.11. 


不 是 同 分 布 的 , 不 能 直接 利 
在 前 面 的 习题 中 , 我 们 看 至 


习题 20.11.15 


在 习题 20.11. 
民 从 同一 个 几何 分 布 , 那么 
F 无 穷 大 时 , 这 个 标准 和 会 收敛 于 


11 中 ， 如 细 


士 胆 全民 
结果 会 是 


作 


果 有 N 个 变量 服从 同一 个 指数 分 布 ， 
| 么 样 的 ? 这 个 和 该 如 何 标准 化 ? 当 


11 中 , 你 要 证 明 


E 态 分 布 吗 ? N 和 M 趋向 了 


用 


FP 心 极限 定理 . 


你 能 


这 个 和 会 趋向 于 服从 了 
找到 解决 这 个 问题 的 好 方法 吗 ? 


胆 有 M 个 变 
N 和 AM 趋 
无穷 大 的 方式 是 否 会 


不 全 会 


E 态 分 布 . 


于 随机 变量 


1， 


上 且 . 
量 


的 随机 变 


之 和 仍然 趋向 


六 服从 了 


在 某 些 情况 下 , 相互 独立 但 不 服从 同一 个 分 布 
E 态 分 布 . 找 一 个 反例 来 说 明 , 相互 独立 的 随机 变 


量 并 不 


习题 20.11.16 
习题 20.11.17 。” 找 一 个 离散 到 
变量 , 如 果 它 们 均 与 该 离散 


习题 20.11.18 


习题 20.11.19 


习题 20.11.20 


污 


总 是 使 得 该 结论 成 立 (也 就 是 说 , 它们 


举例 说 明 , 相关 变量 的 和 不 一 定 趋向 了 


的 和 


电 随 机 变量 


分 布 . 


布 吗 ? 


0.246 01, 而 一 21.75 mod 1 等 于 0.25. 对 于 给 定 的 随 
mod 二 站 mod 1. 如 果 X~Unif(0,1) 并 
肯定 会 服从 [0,1) 上 的 均匀 分 布 
使 其 概率 分 布 满足 下 列 条 件 : 对 于 相互 独立 的 随机 


随机 变量 


那么 (XX 十 Y)mod1 表 
找 一 个 连续 型 随机 变量 


设 X~N(0,1D 和 


型 随机 变 生 


我 们 把 从 实数 集 到 


中 [z] 是 地 板 函 数 ， 它 给 出 了 不 


变量 , 如 果 它 们 均 与 该 连 纪 


分 布 . 
20.11.21 


均值 和 方差 的 方法 有 两 种 . 


概率 都 是 1/n. 


考虑 集合 5S = {a1, a2,… 


到 的 均值 和 方差 是 一 样 的 . 


1 20.11.22 


Ey 


20.11.24 详细 


对 于 函数 f(x), 如 果 了 (一 z) 
20.11.23 ”证 明 对 数 的 换 底 公式 : 
和 解释 为 什么 误差 通 ? 


忘 了 考虑 使 用 标 ; 
20.11.25 你 了 


1 20.11.26 


话 号 码 的 每 位 数字 个 数 加 起 来 , 然后 除 以 数字 


分 布 ? 


马 ? 


型 随机 变 上 


, Qn}, 


E 在 一 个 小 镇 上 对 
1 ~ 10 级 来 表示 (其 中 1 是 应 该 显著 降 
会 服从 正 态 分 布 
你 正在 一 个 小 镇 上 对 1000 个 人 进行 调查 . 你 让 每 个 人 将 其 地 址 、 生 日 和 电 
的 总 数 . 你 认为 反馈 信息 会 服从 什么 样 的 


20.11.27 ”流体 
任何 方向 上 的 移动 与 过 去 的 运动 无 关 . 这 前 
一 维 方向 上 , 一 个 粒子 相对 于 初始 点 
初始 位 置 在 二 维 


空间 中 的 距离 ? 


习题 20.11.28 利 
开始 趋向 于 正 态 分 布 的 过 程 . 


使 其 概率 分 布 满 
时 的 分 布 相同 , 习 


时 的 分 布 相 


[不 趋向 于 是 VD 

F 正 态 分 布 . 

足下 列 条 件 : 对 于 相互 独立 的 随机 
b 么 这 些 随 机 变量 之 和 不 趋向 于 正 态 


pd 


nif(0, 1) 相互 独立 . 那么 和 十 站 一 定 服从 正 态 分 


区 间 [0,1) 上 的 模 1 函数 定义 为 z mod 1 = z 一 [2]( 其 
超过 xz 的 最 大 整数 )， 因 此 ，1701.246 01 mod 1 等 于 


变量 关 , 我 们 可 以 定义 一 个 新 的 


Y 是 任意 一 个 连续 型 随机 变量 ， 
怠 ? 


同 , 那么 这 些 随机 变量 之 和 不 趋向 于 正 态 


其 中 ai 不 一 定 是 互 不 相同 的 . 5 中 全 体 不 同 
的 元 素 构成 了 集合 B = {01,b2,… , Bx}, 其 中 各 元 素 的 重 数 分 别 为 mi,m2,… ,mx( 也 
就 是 说 , 在 5 的 n 个 元 素 中 , 恰好 有 mi 个 等 


Fbi, 恰好 有 m2 个 等 于 bz, 等 等 ). 计算 


=-f( 


氏 , 10 是 应 该 显著 提高 ). 你 认为 这 个 结果 


先 , 我 们 可 以 直接 考察 集合 5, 在 这 n 个 元 素 中 , 每 一 个 的 
其 次 , 我 们 也 可 以 考察 集合 B, b; 的 概率 是 mi/n. 证 明 : 这 两 种 方法 得 


, 那么 说 /是 一 个 奇 函 数 . 证 明 : 当 概 
函数 时 , 任意 一 个 奇数 阶 矩 如 果 存 在 , 那 就 一 定 等 于 0. 
于 任意 的 b,c,x > 0, 有 log。 x 


log, Z/ log, c. 


被 认为 是 服从 正 态 分 布 的 . 在 应 用 CLT 时 , 不 要 


的 粒子 是 按照 随机 游 走 移动 的 , 也 就 是 说 , 在 给 定时 间 段 内 , 它们 在 
是 布朗 运动 . 经 过 一 段 时 间 t 之 后 , 如 何 模拟 
的 位 置 ? 经 过 一 段 时 间 t+ 之后, 如 何 模拟 一 个 粒子 与 


] Mathematica 内 置 的 动画 函数 来 演示 , 服从 均匀 分 布 的 随机 变量 之 和 
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习题 20.11.29 


差 都 存在 . 它 的 矩 坪 函数 是 否 存 在 ? 
从 m = 4 的 广义 柯 


么 ? ( 演 
习题 20.11.30 


考 


虑 习题 17.7.11 上 


PF 服 从 m= 4 的 广义 柯 


巴 相 互 独立 


FE 意 : 这 可 
设 Z ~ N(0,1), 并 设 厂 是 使 得 Prob( 2 e 14) = p 的 区 间 . 对 


西 分 布 的 随机 变量 之 和 进行 比较 . 
个 很 难 回 答 的 问题 ! ) 


台 E 上 旦 


胰 雹 昌 


p < 1 求 出 区 间 长 度 最 小 的 万 . 


习题 20.11.31 ”保留 上 一 题 的 符号 , 为 了 使 得 2 的 均值 
内 , p 的 取 值 范围 是 什么 ? 

习题 20.11.32 ” 设 随 机 变量 X 满足 jw = 10 且 o = 4 从 这 个 总 体 
的 样本 . 求 出 这 100 个 观测 值 的 样本 均值 小 于 9 的 概率 . 


习题 20.11.33 


TI 设 于 三 -的 3 革 


C1 


西 分 布 的 随机 变量 , 其 均 信 
之 和 , 与 服 
E 态 分 布 吗 ? 为 什 


服从 柯 西 分 布 的 随机 变 
门 都 收敛 


| 了 


三 
温 至 


和 方 


( 即 0) 包含 在 区 间 长 度 最 小 的 厂 


P 取 出 一 个 大 小 为 100 


设 4 = {0,0,1,1,1,2,2,2,2,3,3,3,3,3}， 并 且 每 个 元 素 出 现 的 概率 均 为 


P Prob(0) = 2/14, Prob(1) = 3/14, Prob(2) = 4/14 


Prob(3) = 5/14. 证 明 : 4 和 B 具有 相同 的 均值 和 方差 . 
习题 20.11.34 ”对 于 均值 和 方差 都 是 有 限 值 的 分 布 , 到 第 几 阶 矩 (一 阶 和 、 二 阶 矩 .……… ) 
时 , 我 们 才 开 始 看 到 分 布 的 形状 ? 为 什么 不 能 早点 看 到 ? 
习题 20.11.35 设 奥 尔 巴 尼 每 天 发 生 车 祸 的 数量 服从 均值 为 2 的 泊 松 分 布 . 利用 中 心 极限 
定理 来 估算 , 一 年 之 内 在 奥 尔 巴 尼 至 少 发 生 800 起 车 祸 的 概率 . 


习题 20.11.36 


|f(z)| < Cg(x), 那么 f(z) = O(g(x)), 此 
i ti 可 以 描述 成 , 当 |z| < zo 时 |f(x)| < Cg(zx). 训 
2Z 一 oo 时 ,z=O(z2), 以 及 当 z 一 0 时 ,z2 = 0O(z). 
F 意 的 N,r > 0, 当 z 一 co 时 , (log x)* = 0O(x"). 
F 意 的 N > 0, 当 z 一 co 时 , zy = O(e”). 

当 z 一 oo 或 z 一 0 时 , 均 有 7z=O(z/4). 
Ph cosh(z) = 3(er +e “) 是 双 曲 余弦 ， 


近 于 0, 山 

e 当 
对 
对 


> 


EF 


于 人 
于 人 


回 


六 


忆 一 下 , 如 果 存 在 一 个 zo 


具 


局 


e 当 z 一 co 时 , cosh(z) = O(sinh(x)), 其 
sinh(x) 二 3(e* 一 e“”) 是 双 曲 正弦 . 
习题 20.11.37 利用 i= V1 和 
a rz? zx? rz3 
e = 二 二 相交 下 


训 


和 一 个 C > 0, 使 得 对 所 有 的 x > zo 均 有 
对称 f 是 9 的 大 O. 有 时 候 , 我 们 希望 让 x 接 
E 明 下 列 结论 : 


F 明 : ez = cos(z) 十 isin(x). 注意 , sin 和 cos 的 泰勒 级 数 公 式 会 很 有 


j! 


习题 20.11.38 ”( 推 导 三 角 恒 等 式 ) 以 前 面 的 两 个 习题 为 基础 , 利 
isin(z)( 其 中 ?= V=T, 证 明 cos(z) = (ez 十 e ““) 和 sin(x) = 走 (e 
可 以 把 双 曲 三 角 函 数理 解 为 带 有 虚 参 数 的 普通 三 角 函 数 ! (所 以 , 现在 
弦 值 等 于 多 少 了 ! ) 根据 这 些 关 系 式 以 及 es+?” = exe"( 必 须要 说 
我 们 可 以 迅速 地 证 明 所 有 的 三 角 恒 等 式 . 例如 ， 


cos(Z 十 V) 十 ?sin(z 十 人 ) =e 


i(z+Yy) 


Es ei?eiy 


关系 式 @'* 二 cos(Z) 1 
一 ore) 这 样 
汞 应 该 知道 i 的 余 


iT 


E 明 这 一 点 , 参见 B.5 节 )， 


一 (cos(Z) 十 Ysin(z)) (cos(y) + isin(y)); 
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把 右 端 相 乘 的 式 子 展开 , 并 注意 到 两 个 复数 相等 当 且 仅 当 它 们 有 相同 的 实 部 和 虚 部 , 这 样 
就 完成 了 证 明 . 

习题 20.11.39 ”cos(x) = O(sin(z)) 是 否 成 立 ? 为 什么 ? 

习题 20.11.40 ”编写 一 段 代码 , 对 下 列 区 域 做 蒙特 卡 罗 模 拟 . 该 区 域 包含 在 一 个 单位 正方 形 
内 , 它 由 两 个 连续 函数 来 确定 : 0 < f(x) < g(x) < 1. 

习题 20.11.41 “利用 上 一 题 的 代码 , 估算 椭圆 (z/a)? 十 (yb < 1 的 面积 . 通过 改变 参数 a 
和 5 以 及 对 该 区 域 面积 的 模拟 , 推测 该 区 域 面积 作为 a 和 函数 的 表达 式 . 

习题 20.11.42 ”证 明 上 一 题 的 推测 结果 , 并 把 它 推广 到 椭 球 体 (z/a)? 十 (y/50)?++(z/c)?<1 
上 . 

习题 20.11.43 ”单位 圆 的 面积 可 以 写成 4 V1 一 zw3dz. 被 积 函数 VI 一 x7 的 原 函 数 能 否 
写成 一 个 漂亮 的 解析 表达 式 ? 如 果 能 , 找到 它 并 算出 单位 圆 的 面积 . 

习题 20.11.44 设 4 包含 在 一 个 单位 正方 形 内 . 对 于 我 们 的 误差 估计 , 切 比 雪夫 不 等 式 会 给 
出 什么 样 的 边界 ? 如 果 利 用 中 心 极限 定理 , 结果 又 如 何 ? 

习题 20.11.45 ” 设 4 包含 在 一 个 单位 正方 形 内 . 当 4 的 面积 等 于 多 少时 , 估算 它 的 方差 会 
取 到 最 大 值 ? 如 果 让 方差 最 小 , 4 的 面积 该 等 于 多 少 ? 
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任何 与 中 心 极限 定理 一 样 重要 的 定理 都 应 该 有 不 止 一 个 证 明 . 不 同 的 证 明 强 
调 了 问题 的 不 同方 面 . 我 们 的 第 一 个 证 明基 于 和 矩 母 函数 的 性 质 . 这 是 一 个 很 好 的 证 
明 , 主要 思想 也 很 容易 解释 (对 于 “好 ”的 分 布 , 如 果 矩 母 函 数 收敛 于 标准 正 态 分 布 
的 矩 母 函数 , 那么 概率 密度 函数 就 会 收敛 于 标准 正 态 分 布 的 概率 密度 函数 )， 不 吉 
的 是 , 这 个 证 明 利 用 了 复 分 析 中 的 一 些 重要 结果 . 因此 , 我 们 想 给 出 一 个 不 那么 严 
格 的 证 明 . 

遗憾 的 是 , 下面 的 证 明 并 没有 成 功 . 它 也 要 借助 于 复 分 析 中 的 一 些 黑 盒 结 果 . 
既然 这 个 论述 仍然 需要 假设 一 些 超出 本 书 范围 的 结果 , 我 们 为 什么 还 要 费心 思 给 出 
这 个 证 明 呢 ? 原因 有 很 多 . 首先 是 它 引 入 了 积分 变换 , 特别 是 传 里 时 变换 . 一 般 的 
积分 变换 , 尤其 是 傅 里 叶 变 换 在 高 等 数学 中 是 无 处 不 在 的 , 所 以 看 到 它们 并 没有 什 
么 坏处 . 其 次 , 中 心 极限 定理 适用 于 满足 下 列 条 件 的 函数 , 即 在 原点 附近 , 矩 母 函数 
存在 的 函数 . 很 多 概率 密度 函数 都 存在 有 限 的 一 阶 窍 、 二 阶 矩 和 三 阶 矩 , 但 它们 的 
和 矩 母 函 数 并 不 存在 . 考虑 一 个 类 似 于 柯 西 分 布 的 例子 

志和 0 
我 们 不 能 明显 地 看 出 这 是 个 概率 密度 函数 . 显然 , 它 是 非 负 的 . 当 lz| 一 co 时 , 该 
函数 会 迅速 衰减 , 从 而 使 其 积分 收 和 敛 . 然而 , 我 们 并 不 清楚 它 的 积分 值 是 否 为 1, 但 
它 的 常数 项 有 一 些 好 的 特性 (这 里 的 8 应 该 来 源 于 z 的 方 窜 . 另外 , 在 柯 西 分 布 的 
标准 化 常数 中 , 分 母 上 有 一 个 x, 这 里 也 是 如 此 ). 就 我 们 的 目的 而 言 , 这 并 不 重要 ! 
假设 这 里 的 标准 化 常数 是 错 的 谁 会 在 乎 ! 我 们 可 以 找到 一 个 常数 , 不 妨 记 作 
Cs, 它 能 让 Cs/(1 十 23) 成 为 一 个 概率 密度 函数 . 虽然 它 的 均值 、 方 差 以 及 三 阶 矩 
都 是 有 限 的 , 但 它 的 八 阶 矩 显然 是 无 穷 大 , 因为 其 八 阶 算是 
人 z ] dz 

当 |z| 很 大 时 , 被 积 函 数 本 质 上 就 是 Cs, 因此 该 积分 是 发 散 的 . 同样 地 , 我 们 可 以 证 
明 任意 一 个 更 大 的 偶数 阶 窍 都 是 无 穷 大 的 . 因此 , 由 于 和 矩 母 函数 不 存在 , 算 母 函数 
在 原点 附近 不 可 能 收敛 ! 

这 个 例子 说 明了 , 我 们 讨论 中 心 极限 定理 的 方法 过 于 严格 , 它 排 除了 许多 好 的 
分 布 . (例如 , 在 Mandelbrot 关于 金融 和 大 宗 商 品 市 场 分 形 特性 的 研究 中 , 柯 西 分 布 
就 出 现 了 .) 矩 母 函 数 法 存在 根本 上 的 缺陷 : 我 们 无 法 回避 这 样 一 个 事实 , 即 一 些 不 
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错 的 分 布 并 没有 算 坪 函数 , 因此 我 们 不 能 做 任何 要 求 矩 母 函数 存在 的 论述 ! 虽然 相 
互 独立 的 柯 西 分 布 之 和 不 会 趋向 于 正 态 分 布 , 但 上 面 提 到 的 类 似 分 布 却 可 以 . 事实 
上 , 关键 是 存在 有 限 的 均值 和 方差 

解决 这 个 难题 的 一 个 方法 是 研究 概率 密度 函数 的 傅 里 叶 变换 , 它 在 概率 论 中 被 
称 为 特征 函数 . 稍 后 我 们 将 看 到 , 与 矩 母 函数 不 同 , 特征 函数 总 是 存在 的 , 而 且 是 对 
和 矩 母 函 数 的 一 个 非常 接近 的 类 比 . 它 有 更 好 的 性 质 (比如 存在 性 ! ), 而 且 更 易于 分 
析 . 这 样 我 们 就 可 以 采用 之 前 的 证 明 . 整个 思路 与 之 前 相似 , 但 代数 运算 会 略 有 不 
同 . 


本 章 内 容 要 比 很 多 概率 论 入 门 课 高 深 一 些 . 大 多 数 课程 只 是 没有 时 间 进 行 深 
入 研究 . 虽然 我 们 无 法 证 明 所 需要 的 一 切 , 但 会 提供 足够 的 细节 , 从 而 使 整体 框架 
能 够 尽量 清晰 , 并 且 让 你 对 以 后 的 数学 课 要 涉及 的 内 容 有 一 些 了 解 . 
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给 定 一 个 函数 玉 (zx,y) 和 一 个 区 间 了 (通常 是 (00, co) 或 [0,co)), 我 们 可 以 构 
造 一 个 从 函数 到 函数 的 映射 , 如 下 所 示 : 


a / ic a 


由 于 被 积 函 数 与 两 个 变量 x 和 y 都 有 关 , 而 我 们 只 对 z 积分 , 所 以 最 终 的 结果 
是 关于 y 的 函数 .显然 , 用 什么 字母 来 表示 虚拟 变量 并 不 重要 , 其 他 常见 写法 有 
K(t,z)、K(t,s) 或 者 K(x,é&). 我 们 把 KK 称 为 核 , 新 函数 称 为 的 积分 变换 . 

积分 变换 对 于 研究 各 种 问题 都 很 有 用 . 它们 的 效用 源 于 这 样 一 个 事实 : 相关 函 
数 会 使 得 手头 问题 的 代数 运算 更 加 简单 . 我 们 定义 了 两 个 最 重要 的 积分 变换 , 即 拉 
普 拉 斯 变换 和 傅 里 叶 变换 . 

定义 21.1.1 ( 拉 普 拉 斯 变换 ) 设 KK(t,s) =e-s. 了 的 拉 普 拉 斯 变换 记 作 Lf, 被 


a 


Ce f(t)e-stat. 
对 于 给 定 的 函数 g, 它 的 拉 普 拉 斯 逆 变 换 , 记 作 L-1g, 就 是 
1 c+iT 


i 
(L719)(t) = lim — estg(s)ds = lim zi/ elctin)tg(c + iT)id7. 
Ey 
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定义 21.1.2( 傅 里 时 变换 或 称 特征 函数 ) 设 K(x,y) = er2mzzy. 广 的 傅 里 叶 变 换 
记 作 FF 或 六 其 定义 为 


OR 
其 中 ee 
ei? := >》, 一 cos0+ising. 


"sl 
9 的 傅 里 叶 逆 变换 , 记 作 下 -19, 就 是 
a 1 g(gy)ezrizydy 


注意 ， 其 他 教材 对 傅 里 叶 变 换 有 不 同 的 定义 有 时 会 利用 K(z,y) = erizy 或 
K(x,y) = oY/ Van. 


拉 普 拉 斯 变换 和 傅 里 时 变换 是 相关 的 . 令 s = 2xiy 并 考虑 函数 f(x), 其 中 , 当 
z 0 时 f(x)=0. 那么 ,我 们 会 看 到 广 的 拉 普 拉 斯 变换 和 傅 里 叶 变换 是 相等 的 . 
在 这 里 , 我 们 把 f 的 傅 里 叶 变 换 写成 


0 站 jajeranizyda， 


遗憾 的 是 , 其 他 教材 可 能 会 采用 不 同 的 表示 方法 . 有 些 作者 会 使 用 e zy 或 ezy/ 
V2n, 而 不 是 e- 生 zy%. 所以, 当 引 用 一 本 书 或 者 使 用 诸如 Mathematica 之 类 的 程序 
时 , 你 一 定 要 对 这 一 点 做 检查 . 为 什么 会 有 这 么 多 不 同 的 表示 方法 ? 事实 证 明 , 不 
同 的 表示 方法 能 使 不 同 问题 的 代数 运算 更 加 简洁 . 对 我 们 来 说 , 这 个 表示 方法 会 给 
出 最 简单 的 代数 运算 , 这 就 是 我 们 使 用 它 的 原因 . 
给 定 一 个 函数 f, 我 们 可 以 求 出 它 的 变换 . 那么 另 一 个 方向 呢 ? 如 果 知 道 g 是 
某 个 函数 f 的 变换 , 能 从 已 知 的 9 中 推出 了 吗 ? 如 果 可 以 , 那么 相应 的 了 是 唯一 的 
吗 ? 请 注意 , 这 些 问 题 与 第 20 章 从 复 分 析 中 得 到 的 两 个 黑箱 定理 有 多 么 相似 . 那 
时 , 我 们 知道 矩 母 函 数 , 想 要 得 到 概率 密度 函数 . 幸运 的 是 , 当 上 和 9 满足 某 些 特 
定 条 件 时 , 对 这 两 个 问题 的 回答 就 是 “肯定 的 ”. 我 们 要 考察 的 一 个 特别 好 的 函数 
集 是 施 瓦 兹 空间 . 


定义 21.1.3 ( 施 瓦 兹 空间 ) 施 瓦 诊 空 间 ( 记 作 S(R)) 是 全 体 满足 下 列 条 件 的 无 
限 可 微 函 数 f 构成 的 集合 : 对 于 任意 的 非 负 整数 m 和 n, 有 


d”? 
sup +)" < o, 


rER 
其 中 , supscg|9g(z)| 是 使 得 “|g(z)| < B 对 所 有 均 成 立 ” 的 最 小 的 数 B (每 当 看 
到 sup 时 , 你 就 应 该 想到 “最 大 值 ”). 


21.1 积分 变换 555 


每 当 定义 一 个 空间 或 集合 时 , 都 有 必要 去 证 明 它 是 非 空 的 ! 下 面 来 证 明 存 在 
无 穷 多 个 施 瓦 效 函 数 . 我 们 断言 , 对 于 任意 的 1,o e 民 , 高 斯 分 布 的 概率 密度 函数 
ee-0 /125 均 属 于 S(R). 只 需要 做 一 次 变量 蔡 换 , 我 们 就 能 弄 清楚 
E 态 分 布 的 概率 密度 函数 f(x) = 声 e” 


a 
1 二 0 且 o=1 的 特殊 情形 . 显然 , 标准 


是 无 限 可 微 的 . 它 的 前 儿 阶 导 数 分 别 是 


V2 
六 四 = 加- -二 er 
27 
f(x) (x3 37) . i 


利用 归纳 法 , 我 们 可 以 证 明 它 的 n 阶 导数 是 一 个 n 次 多 项 式 pn(z) 与 高 ez /2 
的 乘积 . 为 了 证 明 f 是 一 个 施 瓦 兹 函数 , 由 定义 21.1.3 可 知 ， 我 们 必须 证 认 ” 
(1 J 22)mm . 1 一 Z2/2 


是 有 界 的 . 这 一 点 可 以 由 下 列 事实 得 出 , 即 标准 正 态 分 布 的 概率 密度 函数 比 任何 多 
项 式 的 衰减 速度 都 快 . 也 就 是 说 , 我 们 要 证 明 |z"e-” /2| 是 有 界 的 . 当 |z| < 1 时 ,该 
结论 显然 成 立 ; 当 |z| 较 大 时 , 情况 又 如 何 ? 如 果 只 保留 指数 函数 泰勒 级 数 展开 式 中 
的 一 项 , 那么 (z2/2)*/k! < e* /2 对 于 任意 的 大 均 成 立 , 从 而 有 e-* /2 < R12*/z2*. 
于 是 , |zme-*/2| < kl2*/z2%-m， 如果 令 2k > m, 那么 |zme-*/2| 就 以 kl2* 为 
上 界 . 

现在 我 们 陈述 主要 的 复 分 析 结果 . 当 积分 变换 来 自 于 唯一 输入 时 , 其 陈述 是 精 
确 的 . 我 们 只 给 出 傅 里 叶 道 变换 的 内 容 一 一 陈述 拉 普 拉 斯 逆 变 换 的 结果 会 用 到 复 
分 析 中 大 量 新 的 符号 表示 ! 在 关于 复 分 析 或 傅 里 叶 分 析 的 大 量 教材 中 , 你 可 以 找到 
相关 证 明 (例子 请 参阅 [SS1,SS2]). 


定理 21.1.4 ( 反 演 定理 ) 设 fe€ S(R), 其 中 S(R) 是 施 瓦 效 空 间 . 那么 


= 外 jg)ezrrydy， 


其 中 有 是 太 的 傅 里 叶 变换 . 特别 地 , 如 果 f 和 9 都 是 施 瓦 诊 函数 , 并 且 它 们 的 傅 
里 叶 变 换 相 同 , 那么 f(x) = g(x). 
在 考察 概率 分 布 时 , 函数 与 其 积分 变换 之 间 的 相互 作用 对 我 们 来 说 非常 有 用 ， 


因为 矩 母 函数 就 是 概率 密度 函数 的 积分 变换 ! 回忆 一 下 矩 母 函数 的 定义 Mx(t) = 
sle a 它 意味 着 


Mx(t) = A et f(t)dt. 
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如 果 当 z < 0 时 , f(z) = 0, 那么 上 式 就 是 广 的 拉 普 拉 斯 变换 . 另外 , 如 果 令 t = 
-2xiy 那么 它 就 是 了 的 侍 里 叶 变 换 . 这 与 ( 另 一 个 ! ) 生成 函数 有 关 , 即 X 的 特征 
函数 
特征 函数 : 随机 变量 X 的 特征 函数 是 

gb :了 le 


与 矩 母 函数 不 同 , 如 果 X 的 概率 密度 函数 是 连续 的 , 那么 对 于 所 有 的 t, 特征 图 
数 始终 存在 . 注意 , 特征 函数 本 质 上 是 概率 密度 函数 的 傅 里 叶 变 换 : 这 个 傅 里 叶 
变换 就 是 9( 一 2nt). 


特征 函数 为 什么 始终 存在 ? 回顾 一 下 , 概率 密度 函数 是 一 个 非 负 可 积 的 函数 人 


我 们 有 
= | ea < | le = | fe) = 
这 里 用 到 了 |exz| = 1 这 个 指数 函数 的 绝对 值 之 所 以 等 于 1 是 因为 毕 达 哥 拉 斯 定 
理 ， 对 于 任意 的 实数 0, 我 人 有 ex = cosg + isiang (这 一 点 可 以 从 多 个 角度 来 考 
察 . 一 种 思路 是 , 比较 ee 、cos0 和 sing 的 泰勒 级 数 展开 式 , 注意 i = V=-T. 如 果 
z 一 十 动 是 个 复数 , 那么 |z = zz 其 中 一 a 一动 是 > 的 共 示 复 数 .我 们 把 | 
称 为 > 的 长 度 、> 的 绝对 值 或 > 的 范 数 . 对 我 们 来 说 , 现在 有 


Je?|?2 = (costr +isintz)(costr — isintz) = cos2 刀 十 sin2tz = 1. 
这 是 对 矩 坪 函数 的 巨大 改进 一 一 一 个 物体 所 拥有 的 最 重要 的 属性 就 是 存在 性 , 所 


以 我 们 已 经 取得 了 很 大 进展 . 
此 外 , 我 们 发 现 特征 函数 与 矩 母 函 数 的 关系 很 简单 但是, 一 个 i 带 来 了 相当 
大 的 不 同 ! 特征 函数 与 传 里 叶 变换 密切 相关 , 区 别 就 在 于 输入 值 相差 一 个 因子 2 
从 特征 函数 转换 到 矩 母 函 数 的 意义 要 深远 得 多 , 因子 i 的 出 现 引出 了 非常 不 同 的 性 
质 和 代数 运算 
现在 我 们 明白 了 为 什么 复 分 析 的 结果 可 以 带 来 这 么 大 的 帮助 . 上 面 的 反 演 公 
式 告诉 我 们 , 如 果 初 始 分 布 很 好 , 那么 知道 函数 的 积分 变换 就 等 于 知道 了 这 个 函数 . 
换 句 话说 , 积分 变换 可 以 唯一 地 确定 分 布 

下 面 的 内 容 会 略微 高 深 些 , 这 些 论点 要 放 到 恰当 的 分 析 论 证 过 程 中 . 对 于 函数 
下 : 民 一 C, 如 果 存 在 一 个 有 限 的 闭 区 间 [a 可, 使 得 当 z [a, 相 时 , f(z) = 0, 那么 我 


们 就 说 f 有 紧 支 集 [ww 中 共有 紧 文 集 的 施 瓦 效 函 数 在 许多 论述 中 都 非常 有 用 . 不 
难 证 明 , 给 定 一 个 定义 在 有 限 闭 区 间 [ww 如 上 的 连续 函数 g, 存在 一 个 具有 紧 文集 的 
施 瓦 兹 函数 f, 使 得 f 与 g 能 够 任意 接近 . 也 就 是 说 , 对 于 所 有 的 x € [a,0], 都 有 
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|f(z) 一 g(z)| < e 类 似 地 , 任意 给 定 一 个 这 样 的 连续 函数 g, 按照 上 述 思路 可 以 找 
到 一 系列 定义 在 区 间 上 的 阶梯 函数 之 和 (阶梯 函数 是 有 限 个 定义 在 闭 区 间 上 的 特 
征 函 数 之 和 ), 并 使 得 这 个 和 任意 接近 于 g. 通常 , 要 想 证 明 阶 梯 函 数 的 结果 , 只 需 
要 证 明 连 续 函 数 的 结果 就 够 了 , 这 与 证 明 施 瓦 兹 函数 的 结果 是 一 样 的 . 施 瓦 效 函 数 
是 无 限 可 微 的 , 当 傅 里 叶 反 演 公式 成 立时 , 我 们 可 以 转换 到 傅 里 叶 变 换 空间 , 有 时 
候 研 究 后 者 会 更 容易 些 . 
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傅 里 叶 变 换 的 一 个 重要 性 质 是 在 卷 积 的 作用 下 它 具 有 很 好 的 性 质 . 回忆 一 下 ， 
两 个 函数 f 和 g 的 卷 积 记 作 h = f *g, 其 中 


a f(t)jg(z —t)d t= | f(a 


我 们 自然 会 问 : 为 了 确保 卷 积 存在 , 上 和 9 必须 满足 哪些 条 件 ? 对 我 们 来 说 , f 
和 9 都 是 概率 密度 函数 . 因此 , 它们 都 是 非 负 的 且 积 分 值 都 等 于 1. 虽然 这 是 确保 
h = f*9g 的 积分 值 为 1 所 需要 的 条 件 , 但 并 不 足以 保证 1 *g 是 有 限 的 . 我 们 先 来 
证 明 它 的 积分 值 为 1. 因为 被 积 函 数 是 非 负 的 , 所 以 可 以 交换 积分 次 序 . 注意 , 对 于 
每 一 个 z, 积分 值 要 么 是 非 负 的 , 要 么 是 正 无 穷 . 我 们 有 


A i a gz 一 batdz 
三 1 ft) Li Ee dt. 


括号 里 的 积分 是 1. 如 果 愿 意 的 话 , 你 可 以 做 变量 替换 , 令 w= x 一 t, du = dx. 现在 
我 们 正在 计算 一 个 概率 密度 函数 在 -co 到 co 上 的 积分 , 这 个 值 始终 为 1. 接 下 来 


口 


只 剩 下 了 


/raaaz = 7od=l 

得 到 这 个 结果 同样 是 因为 概率 密 度 函数 在 -co 到 co 上 的 积分 值 为 1. 这 意味 着 , 只 
有 在 测度 (或 长 度 ) 为 无 穷 大 的 集合 上 , 非 负 函数 (f*g)(z) 的 值 才 等 于 0. 如 果 不 熟 
悉 测度 论 也 不 必 担 心 , 这 里 还 有 另外 一 种 说 法 : 对 于 任意 的 M, {x : (fxg)(z) > M} 
的 长 度 不 超过 1/M; 否则 , 积分 值 就 会 大 于 1. 

这 证 明了 对 几乎 所 有 的 z, (f * 9g)(z) 都 是 有 限 的 . f 和 9 必须 满足 哪些 条 件 ， 
才能 保证 对 所 有 的 zx, 其 卷 积 始 终 是 有 限 的 ? 如 果 假 设 上 和 9 是 平方 可 积 的 , 即 
/f(z)?dz 和 万 9(z)2dz 都 是 有 限 的 , 那么 f xg 在 每 一 点 处 都 有 很 好 的 性 质 . 
稍 后 我 们 将 ee 式 来 推出 这 一 点 , 关于 柯 西 - 施 瓦 效 不 等 
式 的 证 明 会 在 B.6 节 中 给 出 . 
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柯 西 - 施 瓦 兹 不 等 式 : 对 于 复 值 函数 上 和 9， 


[oer < (fl 


wo) (foo 


1/2 
oa 


f 和 g 是 平方 可 积 的 这 一 假设 非常 弱 , 我 们 研究 的 所 有 标准 概率 密度 函数 都 


满足 . 即使 不 满足 平方 可 积 的 条 件 , 这 通常 也 没什么 问题 . 例如 , 令 


1 
| 


0 
那么 , f 可 积 但 不 是 平方 可 积 的 , 这 


A/4 


(f *f)(y) = (arccsc (VY) 一 arctan ( 


0 


现在 陈述 一 个 很 好 的 结果 . 正 因为 如 此 , 傅 如 


这 是 一 个 非常 重要 的 结果 , 我 们 会 给 日 


若 0<z<1l 


因为 dz/z 趋 
自身 的 卷 积 是 很 好 的 . 在 做 “一 些 ” 积 分 运算 之 后 , 你 会 发 现 


y — 1))/2 


向 于 无 穷 大 . 也 就 是 说 , f 与 


若 0<y<1l 
若 1<y<2 
其 他 . 
变换 才 会 在 概率 论 中 如 此 普遍 
8 完整 的 证 明 . 


定理 21.2.1 ( 卷 积 与 傅 里 时 变换 ) 设 f 和 9 都 是 肥 上 的 连续 函数 . 如 
果 [|f(z)l2dzx 和 [lg(z)|?dx 都 是 有 限 的 , 那么 h = f *g 存在 ,并且 
有 hh(y) = f(y)9(W). 因此 , 傅 里 叶 变 换 将 卷 积 转换 为 乘法 运算 . 


证 明 : 首先 证 明 = f *g 是 存在 也 


h(x) = (f * 9)(7) 


= fot 
pols {MOO lg = Dlat 


<(f woe) (fle-ora) 


因为 我 们 假设 f 和 9 都 是 平方 可 积 的 , 所 以 
定 的 z, 当 t 从 -co 变动 到 oo 时 , > 一 t 也 会 从 -co 变动 到 co). 我 们 没有 假设 f 
和 9 是 概率 密度 函数 . 如 果 有 这 个 假设 , 那么 


函数 永远 不 可 能 取 负 值 . 


既然 知道 卷 积 h 是 存在 的 , 现在 就 可 以 讨论 它 的 怕 


蕊 


西 - 施 瓦 效 不 等 式 可 得 


Ss 和 
的 


、\ 等 式 训 


是 有 限 的 (对 于 固 


因为 概率 密度 


E 质 了 . 我 们 来 计算 它 的 傅 里 


叶 变 换 . 这 样 就 引出 了 一 个 二 重 积 分 (其 中 一 个 积分 来 源 于 h 的 定义 , 男 一 个 则 是 
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从 傅 里 叶 变换 的 定义 中 得 到 ) 现在 有 两 个 积分 的 事实 提醒 我 们 该 如 何 处 理 该 二 重 
积分 . 通常 情况 下 , 处 理 二 重 积分 可 以 尝试 两 件 事 : 变量 替换 , 或 者 交换 积分 次 序 . 
我 们 选择 交换 积分 次 序 . 这 种 做 法 是 可 行 的 , 因为 绝对 值 的 积分 是 有 限 的 , 而 且 可 
以 利用 富 比 尼 定 理 (参见 定理 B.2.1). 

但 是 , 在 交换 积分 次 序 之 前 , 我 们 先 巧妙 地 通过 添加 0 来 简化 代数 运算 (更 多 
例子 请 参阅 A.12 节 ). 我 们 将 很 快 看 到 关于 g(x 如 与 指数 函数 e-2rizy 的 积分 . 
于 这 里 给 出 的 是 g 在 x -处 的 值 , 我 们 希望 指数 函数 部 分 也 是 关于 zt 的 表达 
式 , 而 不 是 关于 zx. 这 意味 着 x 要 改写 成 zt+t 于 是 


h(y) = 所 h(xz)e sydz 


=- oe Dedtds 

加 / f(t)g(z — t)e— viett yqtdr 

/ > f(t)e2rity , jn ei a 
= Om) ge an at 


一 


_ 六 f (te iyo(y)dt = Fly), 


和 


一 


最 后 一 行 是 从 侍 里 叶 变 换 的 定义 中 得 到 的 . 

0 i 二 1,2,…， 包 部 是 平方 可 积 的 , 请 证 明 对 于 任意 的 i,j 均 
有 [|fi(z)fj(2)| < co. 对 于 户 * ( 户 * 3) (以 及 更 多 个 函数 ), 情况 又 如 何 ? 证 明 
fi* (fo ( 户 * 户 ) * fa. 因此 , 卷 积 满足 结合 律 . 我 们 可 以 把 NN 个 函数 的 卷 积 
写成 户 * …* fn. 如 果 这 里 有 困难 , 请 参阅 19.5 节 中 的 讨论 . 

两 种 运算 可 交换 的 情况 并 不 常见 . 卷 积 的 传 里 叶 变 换 就 是 传 里 叶 变 换 的 乘积 
卷 积 与 乘法 运算 类 似 . 也 就 是 说 , 利用 这 种 特殊 的 乘法 运算 , 可 以 交换 运算 的 次 序 . 
我 们 很 少见 到 能 满足 这 种 规则 的 两 种 运算 . 例如 , Va 十 5 显然 不 等 于 Va 十 Vb. 

下 面 的 引 理 是 利用 传 里 叶 分 析 来 证 明 中 心 极限 定理 的 出 发 点 . 


引 理 21.2.2 设 Xi 和 Xo 是 两 个 相互 独立 的 随机 变量 ， 的 概率 密度 函数 

和 09. 设 f 和 g 均 是 平方 可 积 的 概率 密度 函数 , 那么 [f(z)?dz 和 
六 9g(z)2dz 是 有 限 的 . 因此 , f *g 是 Xi 十 XX 0 数 . 更 一 般 地 , 如 
,XN 是 相互 独立 的 随机 变量 , 它们 的 概率 密度 函数 p1,.…. ,pn 都 是 平 
方 可 积 的 , 那么 plkpox.:…*DN 是 XI 十 … 十 XN 的 概率 密度 函数 . (因为 卷 积 
满足 交换 律 和 结合 律 , 所 以 在 写 pl * p2*.…#*pN 时 ,我们 没 必 要 太 小 心 . ) 
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证 明 : Xi e [z,z+ Az] 的 概率 是 J*+ 人 ”f(t)qt. 当 Az 很 小 时 , 上 述 积分 约 等 
于 f(z)Azx (此 时 , 被 积 函 数 本 质 上 是 个 常数 ). Xi + X2 e [zz 十 Az] 的 概率 就 是 


ooe 2 十 Az 一 Z1 
站 四 站 jz1)g(zz)dzozdzZl， 
当 Az 一 0 时 , 我 们 得 到 了 卷 积 f x g, 并 且 有 
b 
Prob(Xi1 十 Xo2 €la,b]) = A (f * 9)(z2)dz. (21.1) 
我 们 必须 证 明 式 (21.1) 中 的 “概率 ”是 有 意义 的 . 也 就 是 说 , 现在 必须 证 明 f*g 是 
一 个 概率 密度 函数 . 显然 , 由 f(z), g(x) > 0 可 知 , (f * g)(z) > 0. 因为 我 们 假设 f 
和 9 是 平方 可 积 的 , 所 以 
(f *g)(z)dzx = ) 上 f(x — yg(y)dydzr 


一 De 


由 于 f 和 g 是 概率 密度 函数 , 所 以 上 述 积分 值 都 等 于 1, 结论 得 证 . 

注 ”实际 上 , 我 们 不 需要 假设 概率 密度 函数 是 平方 可 积 的 . 这 个 假设 是 为 了 确 
保 随 机 变量 之 和 的 概率 密度 函数 在 任何 地 方 都 是 有 限 的 ， 如果 允 许 概率 密度 函数 
在 某 些 地 方 是 无 穷 大 , 我 们 就 可 以 去 掉 这 个 假设 . 

虽然 本 节 介绍 了 大 量 内 容 和 结果 , 但 我 们 开始 看 到 整体 框架 了 .如 果 给 出 N 
个 相互 独立 且 概 率 密度 函数 分 别 为 p1,… ,pw 的 随机 变量 , 那么 变量 和 的 概率 密度 
函数 就 是 p= pi*…*py. 乍 一 看 , 这 个 等 式 好 像 很 可 怕 (对 于 六 个 服从 指数 分 布 
的 随机 变量 , 其 概率 密度 函数 的 卷 积 是 什么 ? ), 但 这 里 有 一 个 显著 的 简化 过 程 . 根 
据 卷 积 的 傅 里 叶 变 换 就 是 傅 里 叶 变 换 的 乘积 , 我 们 看 到 Fy)= 雇 (y)…Pn(). 在 随 
机 变量 服从 同一 个 分 布 的 特殊 情况 下 , 这 又 进一步 简化 为 讽 (y) 六 .此 时 , 为 了 证 明 
当 所 有 概率 密度 函数 都 相等 时 的 中 心 极限 定理 , 我 们 “只 需要 ”( 遗 憾 的 是 , 其 中 包 
含 了 很 多 内 容 ) 证 明 ; 当 N 一 co 时 , 抽 (y)” 会 收敛 到 某 个 正 态 分布 的 傅 里 叶 变 换 
( 记 住 , 这 个 和 没有 标准 化 ), 而 且 傅 里 叶 逆 变 换 被 唯一 确定 且 服 从 正 态 分 布 . 


21.3 ”中 心 极限 定理 的 证 明 


现在 给 出 中 心 极限 定理 的 证 明 框架 我 们 要 证 明 的 版 本 比 之 前 讨论 的 更 一 般 
化 . 现在 已 经 不 需要 假设 矩 母 函 数 的 存在 性 . 为 了 真正 掌握 住 该 证 明 的 细节 , 我 们 
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建议 你 给 出 下 面 一 系列 问题 的 完整 细节 , 每 一 个 问题 都 提供 了 证 明 所 需 的 另 一 个 输 
入 . 


定理 21.3.1 (中 心 极限 定理 ) 设 Xi1,… ,XN 是 独立 同 分 布 的 随机 变量 , 它们 的 
前 3 阶 和 天 都 是 有 限 的 , 而 且 概率 密度 函数 的 衰减 速度 足够 快 . 用 j1 表示 均值 , o? 


ea x 2 
pe te 
N 
并 设 
记过 XN—h 
o/VN 


那么 当 N 一 oo 时 , Zw 的 分 布 将 收敛 于 标准 正 态 分 布 . 


我 们 会 强调 关键 步骤 , 但 没有 给 出 具体 理由 (这 需要 利用 关于 傅 里 叶 变 换 的 几 
个 标准 引 理 , 例子 请 参阅 [SS1]). 不 失 一 般 性 地 , 我 们 可 以 考虑 下 列 情形 , 即 概率 密 
度 函 数 p 定义 在 玉 上 , 它 的 均值 为 0 且 方差 为 1 (参见 20.4 节 ). 我 们 假设 概率 密 
度 函 数 的 衰减 速度 足够 快 , 从 而 使 得 下 列 所 有 卷 积 积分 都 收敛 . 
具体 地 说 , 概率 密度 函数 p 满足 


apGdz = 0， i / ns (21.2) 


一 co 一 co 


设 Xi,X2,… 是 从 p 中 取出 的 相互 独立 且 同 分 布 的 随机 变量 , 因此 Prob(X; e 
[a,9) = 放 p(z)dz. 定义 Sw = 站, Xi， 回顾 标准 高 斯 分 布 (均值 为 0, 方差 为 1) 
的 概率 密度 函数 为 exp( 一 x2/2)/V2x. 

由 于 我 们 假设 j=0 且 o=1, 所 以 Zw = 人 = Xx 于 是 
Zw = SN/VN. 我 们 必须 证 明 SN /VN 依 概率 收敛 于 标准 高 斯 分 布 : 


. ON a 二 
Jim_ Prob (学 € 中 = 去 / e Tdx. 
现在 给 出 证 明 . p 的 传 里 叶 变换 是 


让 JJ 三 站 pzje-2mizydz. 


显然 , PW)| < [p(x)dz =1 HB0)= 广 -p(z)dz=1 
断言 1: 傅 里 叶 变 换 的 一 个 有 用 性 质 是 , $ 的 导数 是 2rizg(z) 的 傅 里 叶 变 换 . 因此 ， 
微分 运算 ( 较 难 ) 被 转化 成 了 乘法 运算 ( 较 简 单 ). 具体 地 说 , 证 明 


oo 


9(y) = / 2riz . g(r)e Ydx. 


如 果 9 是 个 概率 密度 函数 , 那么 了 (0) = 2ziE[zx] 有 97(0) = 一 4n?E[z2]. 
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上 述 内 容 表 明了 为 什么 使 用 侍 里 叶 变 换 来 分 析 概 率 分 布 是 很 自然 的 . 均值 和 
方差 (以 及 更 高 阶 的 矩 ) 是 分 在 0 点 处 各 阶 导数 的 倍数 . 根据 断言 1, 由 p 的 均值 
为 0 且 方 差 为 1 可 知 ,你 (0) = 0, (0) = 一 4m?. 对 分 做 泰勒 展开 (我 们 没有 证 明 这 
个 展开 式 的 存在 性 及 收敛 性 ; 但 对 于 大 多 数 问题 , 这 一 点 可 以 去 直接 验证 . 这 就 是 
我 们 需要 关于 p 更 高 阶 矩 的 技术 条 件 的 原因 ), 我 们 发 现 , 在 原点 附近 有 

Ply) =1+ Sp + = 1—2ny +O(y). (21.3) 
在 原点 附近 , 上 述 内 容 表 明了 依 看 起 来 像 是 一 个 下 目的 抛物 线 . 因为 (0) = 0, 所 
以 上 面 没 有 y 项. 这 里 的 O(y?) 是 一 个 大 O 表示 法 , 它 表 示 数 量 级 不 超过 y3 的 误 
差 项 ; 关于 大 O 表示 法 的 更 多 内 容 , 请 参阅 20.6 市 . 

由 21.2 节 可 知 : 


。 Xi 十 … 十 XN & [a,9] 的 概率 等 于 (px*- (2)dz. 
。 傅 里 叶 变 换 将 卷 积 转化 为 乘法 . 如 果 i l f 的 傅 里 叶 变 换 在 y 点 
处 的 值 , 那么 


FTlpx*::.*p](y) = Pl(y) :PY). 
然而 , 我 们 并 不 想 研究 Xi+.…+Xw =z 的 分 布 ,而 是 希望 弄 清楚 SN = 关 苇 圭 s = 
z 的 分 布 . 
断言 2: 如 果 存在 一 个 固定 值 c 关 0, 使 得 B(z) = A(cz), 证 明 B(y) = 14 (2). 
断言 3: 证 明 如 果 Xi 十 … 十 XN = 的 概率 密度 函数 是 (px…x*p)(x) ( 即 和 的 分 布 
由 px.…xp 给 出 ) 那么 守 革 守 2Y = 2 的 概率 密度 函数 是 (VNpx.…*VNp)(zVN). 
利用 断言 2, 证 明 


pT [VNpx.e + VN I)]| W) = 区 


上 述 内 容 可 以 让 我 们 确定 Sw 分 布 的 传 里 叶 变换 . 它 就 是 [5( 为) .对 于 国 


N 


定 的 y, 我 们 令 N 一 co. 由 式 (21.3) 可 知 Bly) = 1 一 272y2 + O(03). 因此 , 我 们 必 
须 考察 本 
[ (如 ) , 
N N3/2 
对 于 固定 的 y, 我 们 有 
N 
im [ 人 o (总 让 | = er2my (21.4) 


er 有 两 个 定义 (参见 B.3 节 的 结尾 )， 虽然 我 们 通常 使 用 无 穷 和 展开 , 但 此 时 乘积 
公式 更 有 用 : 


TT\N 
”Co 1 (1+ 广 ) 
e 1 


No—=00 


21.4 


4 
二 、 
/SN 


(你 可 能 会 从 复 利 


中 回忆 起 这 个 公式 )， 当 然 , 这 章 


F 不 是 一 个 完 


在 于 我 们 没有 完全 相同 的 定义 设置 , 因 
一 种 严格 的 方法 是 对 式 (21.4) 的 两 端 同时 取 对 数 , 并 六 


端 相等 . 
题 需 要 刊 
在 学 习 
总 而 言 之 
忘 e-z /2, 因 


明 : 


御用 复 分 析 中 的 结果 . 如 果 想 了 解 更 多 细节 , 我 们 向 读者 推荐 [Fe]， 


E 明 . 


证 
训 


与 p 的 精 


用 来 研究 具有 相似 
在 中 心 极限 定理 
上 的 应 上 


本 福特 定 得 


| 用 复 分 析 中 的 
更 多 的 数学 知识 后 , 你 会 明白 
的 傅 里 叶 变 换 收 和 剑 于 e-2mg2， 


E 明 的 关键 在 于 我 们 
里 叶 变 换 可 以 把 卷 积 转化 为 乘法 . 
的 项 才 起 作用 . 具体 地 说 , 对 于 “好 的 ”p, Sy 的 分 布 会 收敛 于 标准 高 
日 方差 为 1 实际 上 只 是 一 
规模 的 所 有 概率 分 布 ; 参见 20.4 节 . 

中 , 高 阶 项 在 确定 收敛 速度 方 盏 


4 细 结 构 无 关 . p 的 均值 


为 这 里 有 


数量 


2 
Ge 一 2TV 


这 一 点 . ) 


SN 分 布 


此 Sw 等 于 z 的 分 布 会 收敛 于 


尾 傅 里 叶 分 析 来 在 


的 傅 里 叶 变 换 在 > 处 的 值 等 
道 积分 . 如 果 你 没有 学 过 复 分 析 ” , 这 就 是 另 一 


和 


于 太 


并 且 


oe-2mw 的 傅 昌 


全 严格 的 证 明 . 问题 
级 较 小 的 误差 项 O(y 3 /N32), 
主意 到 当 N 一 co 时 , 式 子 两 


e-”/2. (提示 : 这 个 问 


[ 合 - 
个 黑 盒 结 


果 . 


E 叶 变换 是 


二 6-”/2, 对 这 些 内 容 的 证 明 需 要 


i hs 
它 会 给 出 


完整 的 


究 独 立 同 分 布 的 随机 变 昌 


量 之 和 , 因 关 


普遍 性 是 


为 0 


日 请 参阅 [区 onMil). 


这 里 有 一 些 值得 思考 的 好 问题 


。 修 改 证 
。 在 p 的 


明 来 处 理 pb 的 均值 为 1 且 


于 在 泰勒 展开 式 " 


二 次 项 及 之 


发 挥 着 重 


方差 为 o? 的 情况 . 


合理 假设 下 , 估计 收敛 到 高 斯 分 布 的 速度 


可 能 地 从 p 


况 下 , 中 
时 ， 


室 不 奇怪 ， 


应 该 在 我 们 的 预料 之 中 . 为 什 


P 心 极限 定理 仍然 成 立 . 


当 存在 


要 作用 


设 py 和 pa 是 两 个 满足 式 (21.2) 的 概率 密度 函数 
其 中 对 于 每 一 个 i, Xi 等 


或 p2 


固定 有 限 多 个 ; 


21.4 


的 
/AN 


傅 里 叶 分 析 证 明 法 与 矩 


么 呢 ? 和 矩 母 函 


特征 


函数 ) 是 


vle | 如 果 


AH 让 


证 处 
并 非 如 此 . 


这 种 关系 揭示 了 断言 1. 现在 你 应 该 很 清楚 


了 很 大 的 不 同 ! 对 于 任意 的 概率 密度 函 


中 


随机 


情况 又 如 何 ? 此 时 , 对 于 每 一 个 i,X; 取 自 


结 


= 


母 函 数 证 明 法 在 
数 是 Mx(t) = Ele 
果 令 上 mm 一 2xiy, 这 两 个 表达 式 就 关联 了 起 来 , 但 


数 , 特征 函数 始终 存在 , 但 


口才 


取 . 


斯 分 布 , 这 
个 标准 化 的 过 程 ， 


已 


( 详 见 [Fel], 在 


证 明 : 在 这 种 情 
这 样 的 分 布 pi,.… ， 
p; 的 概率 是 qi (当然 q 


搬 虑 SN 一 Xi 十 … 十 XN， 


Dk 


结构 上 有 许多 相似 之 处 . 这 


X], 而 傅 里 时 变换 (或 


是 i 


和 


E 杯 函数 却 


坦 为 什么 傅 里 时 变换 的 导数 与 概率 


AS -~ 辫 


564 和 镍 21 许 


傅 里 叶 分 析 与 中 心 极限 定理 


密度 函数 的 矩 有 关 : 因为 傅 里 时 变换 与 矩 母 函 数 非常 相似 ,而 矩 母 函数 的 导数 就 


是 矩 . 


在 数学 上 , 我 们 可 以 做 


的 事情 是 无 穷 无 尽 的 . 我 们 几乎 可 以 定义 任何 东西 


问 


题 是 哪些 定义 是 有 用 的 , 哪些 定义 会 带 来 好 的 观点 . 在 定理 21.2.1 中 , 我 们 看 到 了 


卷 积 的 傅 里 叶 变换 就 是 傅 里 


试 使 用 卷 积 ， 


因为 这 是 寻找 概率 密度 函数 最 


叶 变换 的 乘积 . 当 研究 随机 变量 的 和 时 , 我 们 很 难 不 学 
自然 的 方法 . 由 于 健 里 叶 变 换 与 卷 积 6 


以 很 好 地 相互 作用 , 我 们 利用 传 里 叶 变换 去 证 明 也 就 不 奇怪 了 . 


题 


西 - 施 瓦 兹 不 等 式 成 为 等 式 . 试 着 找 


西 


21.5 习 
习题 21.5.1 ”找到 关于 f 和 g 的 足够 多 的 条 件 , 使 得 柯 
出 其 中 最 弱 的 条 件 . 
习题 21.5.2 ”计算 f(z) = efzl 的 传 里 叶 变换 . 
习题 21.5.3 ”证 明 : 9(y) = [27iz .g(x)e "Ydz. 
习题 21.5.4 ”证 明 上 断言 2: 如 果 存 在 一 个 固定 值 c 去 0， 


14 (2). 
习题 21.5.5 
中 的 技巧 , 我 们 可 以 找到 


hi 


使 得 B(x) 


m € {1,2,3,4} 时 , 找 出 常数 Czm, 使 得 


30 2m 
一 co 1 十 z2mm 


C 


dz = 1. (使 用 


习题 21.5.6 ”利用 er 、cosz 和 sinx 的 泰勒 级 数 展开 式 ,“ 证 明 ”: ez = cosz 十 1sin z. 
习题 21.5.7 ”证 明 : (£1(Lf)(s))(z) = f(z). 

习题 21.5.8 ”证 明 : (71(Ff)(s))(z) = f(z). 

习题 21.5.9 ”证 明 : 任意 一 个 具有 紧 文 集 (也 就 是 说 , 仅 在 有 限 区 间 上 , 函数 值 才 不 为 0) 的 


西 分 布 是 严格 稳定 的 . 也 就 是 说 , 两 个 相同 的 柯 


无 限 可 微 函数 都 包含 在 施 瓦 兹 空间 中 . 
习题 21.5.10 ”解释 一 个 函数 是 如 何 既 光滑 又 有 紧 文 集 的 . 
习题 21.5.11 ”证 明 : 柯 西 分 布 不 属于 施 瓦 兹 空间 . 
习题 21.5.12 ”利用 特征 函数 证 明 : 柯 
之 和 能 够 通过 调整 原始 分 布 的 比例 来 得 到 . 
习题 21.5.13 ” 设 f 是 一 个 非 负 连续 函数 ， 证明: 


jz) = 0. 
习题 21.5.14 ” 设 Xi ~ Exp 
则 fx;(z) = 0. (a) 求 出 


1), 相应 


的 概率 密度 函数 , 你 能 为 


习题 21.5.15 


积 记 作 (v1,v2)， 如 果 一 


数 ， 它 把 两 个 “向 量 ” 映 身 


(我 们 只 考虑 实 值 


个 函数 是 内 积 , 那么 它 必须 满足 三 条 性 
直 函 数 ， 复 值 函 数 的 情形 有 些 不 同 ); 线性 
a(v1;,v3) 十 (v2,v3); 最 后 , 向 量 与 自身 的 内 积 始终 是 非 负 


分布 


六- fn(7)dz < co 推 不 出 lm 一 = 


的 概率 密度 函数 满足 : 当 z > 0 时 , fx,(z) = e 7; 否 
Jrxi * fxs.(b) 更 一 般 地 , 对 于 三 个 、 四 
它们 的 卷 积 找 到 一 个 解析 表达 式 吗 ? (c) 如 果 指 数 分 布 的 参数 不 
同 , 比如 参数 分 别 是 入 和 和 2, 结果 又 如 何 ? 
内 积 是 一 个 函 


个 或 任意 多 个 指数 分 布 


成 一 个 值 . 我 们 把 w_ 和 va 的 内 


质 : (v1,v2) 二 (v2,v1) 


性 质 , 即 ((avi 十 bv2),v3) 一 
的 , 仅 当 该 向 量 为 0 向 量 时 , 它 


21.5 习 题 565 


与 自身 的 内 积 才 为 0. 证 明 : 如 果 把 随机 变量 X 和 Y 看 作 两 个 向 量 , 那么 E[XY] 就 是 
个 内 积 . 

习题 21.5.16 ” 柯 西 - 施 瓦 效 不 等 式 有 一 个 更 一 般 的 形式 : |(z, 办 2 < (zz)》 . (y,y). 利用 这 
个 不 等 式 证 明 : X 和 YY 的 协 方差 的 平方 小 于 它们 方差 的 乘积 . 

习题 21.5.17 ”利用 特征 函数 证 明 : 对 于 相互 独立 且 服 从 同一 个 指数 分 布 的 随机 变量 , 它们 
的 和 服从 爱 尔 朗 分 布 . 

习题 21.5.18 ”找到 一 个 不 存在 傅 里 叶 变 换 的 函数 . 

习题 21.5.19 ”对 于 服从 参数 为 1 的 指数 分 布 的 随机 变量 之 和 , 以 及 服从 [0, 1] 上 均匀 分 布 
的 随机 变量 之 和 , 其 中 哪 一 个 趋向 于 正 态 分 布 的 速度 更 快 ? 

习题 21.5.20 ” 画 出 服从 参数 为 1 的 指数 分 布 的 随机 变量 之 和 , 以 及 服从 [0,1 上 均匀 分 布 
的 随机 变量 之 和 , 并 验证 你 在 上 一 题 给 出 的 假设 . 
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假 设 


检 验 


如 果 你 的 实验 结果 需要 一 个 统计 员 , 那 你 就 需要 重新 设计 一 个 实验 了 . 


在 2003 到 2004 自 


F, 我 参加 了 美国 


位 发 言 者 提 到 , 天 气 卫 星 每 天 传送 的 信息 比 整 
只 有 几 个 小 时 来 分 析 数 据 并 进行 预测 . 现 有 的 
也 是 最 大 的 挑战 之 一 . 忽视 这 些 数 据 囊 


报 员 


规 的 财务 影响 到 描述 物理 学 中 下 
收集 与 这 个 问题 相 


要 组 成 部 分 . | 


俄亥俄 州立 大 学 


_ 欧 内 


个 国会 图 书馆 的 信 ， 


斯 特 


卢 配 福 


的 数据 分 析 研 讨 会 . 记得 有 


FE 富 数据 是 21 世纪 的 福音 之 一 ， 
会 为 自己 招来 风险 . 通常 情况 下 , 我 们 可 以 
通过 数学 模型 来 研究 感 兴趣 的 问题 : 从 预测 天 气 到 选择 专业 运动 队 , 从 判断 法 律 法 
的 基本 粒子 和 力 . 我 们 给 出 关于 某 问 
关 的 数据 , 看 看 这 些 数据 是 否 支 持 我 们 的 观点 . 
这 样 我 们 就 进入 了 一 个 非常 重要 的 领域 一 一 模型 检验 , 它 是 统计 学 的 一 个 重 
于 这 是 一 本 概率 论 教材 而 不 是 统计 学 教材 , 对 此 的 论述 必须 非常 简 


题 的 一 个 假设 ， 


短 . 但 是 , 很 多 课程 实际 上 既 包含 了 概率 论 , 又 包含 了 统计 学 知识 , 因此 我 决定 用 较 


长 的 一 草 略 微 讨 


为 什么 可 以 相 


i 
二 这 


和 定理 ， 


因此 下 面 的 内 


接 下 来 的 重 


不 能 取代 统计 学 的 
励 你 继续 学 习 . 下 一 节 的 检验 法 
入 门 课 中 , 大 部 分 例子 都 具有 


带 有 来 知 


容 能 很 好 地 回顾 我 们 所 学 知识 3 
是 介绍 一 些 主要 的 检验 方法 , 以 及 它们 为 什么 有 


完整 课程 , 但 希望 它 能 


F 细 地 介绍 统计 学 . 我 强烈 建议 你 将 来 参加 
学 课 上 , 你 会 遇 到 很 多 不 同 的 检验 , 它们 可 
检验 结果 ? 因为 概率 ! 本 章 的 检验 来 源 于 概率 论 中 的 很 多 结论 


门 统计 学 课程 . 在 统计 


以 确定 数据 是 否 与 你 的 猜想 


是 对 本 书 前 面 内 容 的 一 个 非常 好 且 


的 目标 是 看 
国人 所 拥 


看 到 其 效用 . 


致 . 我 们 


让 你 更 好 地 了 解 概 率 都 能 做 些 什么 , 并 激 


重要 的 应 用 . 在 
下 列 形 式 : 有 一 个 总 体 , 而 我 们 感 兴趣 的 量 取 自 某 个 
参数 的 标准 分 布 ; 关于 未 知 参 数 应 该 等 于 多 少 , 我 们 有 一 定 的 想法 ; 最 终 
看 数据 是 否 支 持 我 们 对 这 个 参数 值 的 断言 . 例如 , 我 们 可 能 认为 , 美 
有 的 财富 会 服从 入 = 60 000 美 元 的 指数 分 布 . 然后 我 们 要 收集 数据 . 我 们 


的 数据 不 太 可 能 与 参数 为 60 000 美元 的 指数 分 布 完 全 拟 合 , 因此 我 们 的 目标 是 量 


串 


化 数据 与 分 布 之 间 的 接近 程度 , 并 讨论 观测 值 意味 着 什么 . 更 有 趣 的 是 , 我 人 


认为 财富 值 会 服从 一 个 指数 分 布 , 但 不 知道 其 参 


到 最 合适 的 指数 分 布 (同时 看 看 这 和 


] 可 色 


CC 


数 是 多 少 , 现在 想 通 过 观测 值 来 找 


Fh 方法 可 以 做 到 多 好 ). 


22.1 


22.1 了 检 


验 


我 们 首先 描述 原 假设 和 备 择 假设 , 然后 讨论 显著 性 水 平 及 检验 统计 
上 检验 的 比较 展开 讨论 . 通过 例子 来 学 习 知识 要 比 只 讲理 论 更 加 
入 了 > 统计 量 和 z 检验 , 并 利用 它们 来 给 出 相关 讨论 和 示例 . 


单 侧 检验 与 双 俱 
易 , 所 以 我 们 引 


Z 检验 569 


= = 


量 , 最 


CE 


后 对 
谷 


本 节 要 点 


。 有 一 种 方法 可 以 检验 假设 的 真实 性 , 即使 存 召 


E 随 机 性 也 可 行 . 


。 我 们 假定 假设 成 立 , 然后 收集 数据 . 


。 通过 计算 数据 的 可 能 性 


设 是 否 


FE 来 决定 我 们 的 假 有 效 . 


我 们 将 广泛 使 
参阅 第 14 章 来 回 


与 正 态 分 布 相 关 的 二 


顾 . 


22.1.1 ” 原 假设 与 备 择 假 设 


假设 麦当劳 推 


平均 时 间 是 45 秒 . 显然 每 个 订 自 
变化 . 作为 一 个 怀疑 论 者 , 当下 次 去 麦当劳 时 , 你 会 做 一 些 调查 : 
E 差 是 8 秒 . 鉴于 这 些 数据 , 你 相 


中 , 你 发 现 平均 服务 
说 法 吗 ? 
回 


8 了 一 项 新 的 三 


答 这 个 问题 有 一 个 主要 的 障碍 : 你 选 


-二 


实 ,以 及 它 的 累积 分 布 函数 ( 


这 
中 


记 作 &)， 


传 活动 , 声称 它们 处 理 每 


万 旦 . 


者 


是 不 同 的 , 所 以 实际 情况 会 围绕 均 


个 订 


所 花费 的 


家 产生 一 些 


时 间 是 48 秒 , 标准 


区 的 样本 上 共有 随机 性 


味 着 麦 
在 你 观察 的 过 程 中 ， 
来 外 


当 劳 的 速度 比 他 


门 声称 的 慢 , 但 也 可 能 是 你 选 
F 儿 童 棒球 队 正好 进来 庆祝 朋 
虑 到 你 的 样本 不 寻常 


也 访 


定 麦当劳 是 否 在 说 实话 , 这 个 过 程 会 考 


程 称 为 假设 检验 . 


在 很 多 情况 下 ， 


我 们 都 需要 评估 一 


人 


的 速度 , 以 及 丰 


= 


种 新 药 是 否 比 现 有 


这 
口 


实验 员 或 研究 者 试 


图 订 


E 明 的 结论 相反 , 我 们 人 


假设 . 原 假设 通 


的 , 并 试 着 利 / 


吊 -可 


也 就 是 说 , 我 们 假设 平均 服务 时 间 最 多 为 45 秒 . 在 


数据 来 
秒 慢 , 原 假设 ( 记 作为 Ho) 可 外 


E 如 下 所 示 : 


原 假 设 : Ho: 1 < 45. 


提出 备 择 假设 , 这 通 


常 是 我 们 想 要 证 明 的 事实 . 在 麦当劳 的 例子 


及 ,) 就 是 


备 择 假设 : Hs。: yj > 45， 


了 的 样本 速度 恰好 很 慢 
E 利 . 我 们 需要 一 个 正 


在 20 个 订单 样本 


言 麦当劳 的 


. 你 的 样本 均值 意 


式 的 过 程 
生 . 这 个 过 


的 可 能 | 


项 声明 是 否 有 效 , 比如 考察 麦当劳 处 理 订单 
的 药 更 好 . 假设 检验 的 第 一 


步 是 建立 一 个 原 


原 假 设 是 正 帮 


-x 


A 


自 


以 麦当劳 为 例 , 由 于 我 们 认为 平均 服务 时 间 jy 比 45 


建立 了 原 假 设 之 后 , 还 必须 


FP, 备 择 假 设 ( 记 作 
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这 就 是 我 们 想 要 的 结果 . 注意 , 备 择 假设 与 原 假设 是 互补 的 , 意味 着 它们 共同 涵盖 


了 值 的 每 一 种 


Ho: 414 < 45, 


的 性 能 允 


门 会 认为 原 假设 是 “ 


可 能 . 我 们 不 能 有 以 下 假设 : 


Ha: /> 46, 


因为 这 种 假设 没有 包含 和 5 < jp < 46 的 情况 . 你 要 记 住 的 一 个 重点 是 : 原 假设 与 备 
择 假 设 必须 包含 被 测量 参数 的 每 一 个 可 能 

假设 检验 最 重要 的 一 个 方面 就 是 我 们 的 论述 方式 ， 如 果 想 证 明 一 种 药物 是 有 
药物 是 无 效 的 ” 在 假设 药物 无 效 的 前 提 下 , 如 果 药 物 
E 以 判断 , 就 拒绝 原 假设 并 给 出 药物 有 效 的 结论 . 但 要 注意 , 我 们 不 会 假设 
药物 是 有 效 的 , 具有 当 药 物 可 以 提供 充分 的 理由 时 , 我 们 才 会 修正 假设 . 更 令 人 


值 . 


了 由 


服 的 说 法 是 ,“ 这 种 药 已 经 证 明了 
22.1.2 ”显著 性 水 平 


且 确 定 了 原 假 设 与 备 择 假 设 , 该 如 


绝 Ho, 转 而 支持 备 择 


自己 ”, 而 不 是 说 “这 种 药 还 没有 搞 砸 ”. 


可 检验 它们 呢 ? 我 们 假定 原 假设 成 立 , 然 


后 考察 我 们 的 数据 . 在 原 假设 Ho 下, 如 果 收 集 这 些 数据 的 概率 足够 小 , 那么 就 拒 
腿 设 Hs. 这 种 论证 方式 对 你 来 说 可 能 比较 陌生 , 所 以 下 面 给 
出 一 个 例子 . 不 妨 想 象 你 是 一 名 生物 学 家 , 正在 测量 
表明 , 当地 成 年 鳄 的 长 度 服从 正 态 分 布 : 它 
寸 ( 记 住 , 1 英尺 等 于 12 英寸 ”)， 假设 你 测量 了 其 中 


拒 


新 发 现 的 一 组 鳄 . 先前 的 研究 
门 的 平均 长 度 为 6 英尺 , 标准 差 为 6 英 
一 只 新 鳄 , 发 现 它 的 长 度 是 


三 | 


14 英 斥 . 你 认为 这 是 当地 鳄 吗 ? 可 能 
差 ! 你 的 意 
正 态 分 布 , 那么 遇 到 一 条 长 度 为 14 英尺 
是 当地 鳝 


\ 十 ， 
如 是 :如 果 当 地 成 年 鲁 的 长 度 服 从 均值 为 6 英尺 且 标 准 差 为 6 英寸 的 
的 当地 鳄 的 概率 会 非常 小 .” 在 假设 这 条 鲍 
的 前 提 下 , 你 收集 的 证 据 是 如 此 不 可 信 , 所 以 你 认为 这 条 鳄 可 能 不 是 当地 


因为 它 的 长 度 比 平均 值 高 出 16 个 标准 


的 ( 换 句 话说 , 你 的 假设 是 错误 的 ). 这 里 


的 Ho 表示 新 鳄 是 当地 的 , 而 Hs 表示 新 馈 


不 是 当地 的 . 我 们 拒绝 Ho 并 文 持 Hs 是 
英尺 . 


你 可 能 已 经 注意 到 我 们 刚才 给 


的 推理 


因为 在 Ho 的 前 提 下 , 鳄 不 太 可 能 长 达 14 


中 的 一 个 问题 : 


多 不 太 可 能 才 是 不 可 


能 的 ? 如 果 鳄 是 7 英尺 长 呢 ? 在 这 种 情况 下 , 鳄 只 比 均值 高 出 2 个 标准 差 , 这 是 很 


罕见 的 , 但 也 不 是 闻所未闻 . 


区 


为 了 解决 这 个 问题 , 我 们 通常 会 设置 


个 显著 性 水 平 (也 称 为 a 水 平 ). 显著 


性 水 平 描述 了 我 们 能 够 接受 的 不 同 结果 
立 的 前 提 下 , 如 果 从 数据 中 观测 到 的 结 


四 
个 


的 限度 . 0.05 的 a 水 平 意味 着 , 在 原 假设 成 
出 现 的 概率 小 于 5%, 就 拒绝 原 假设 ， 设 


置 一 个 a 水 平 的 优点 是 , 对 于 我 们 
这 也 是 一 个 缺点 ， 


Q@ 1 英尺 约 等 于 0.3 米 , 1 英寸 约 等 于 2.5 厘米 . 


可 以 接受 的 事件 范围 , 它 
因为 这 让 我 们 失去 了 灵活 性 ! 稍 后 将 讨论 显著 性 水 平 的 作用 和 缺 
陷 . 如 果 次 定 采用 这 种 思路 , 你 应 该 在 看 到 数据 之 前 确 


给 出 了 一 个 硬性 限于 


PE 一 二 


定 边界 点 ! 


一 一 编者 注 
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有 一 个 简单 的 方法 可 以 可 视 化 a 水 平 . 不 妨 设 我 们 已 经 给 出 了 下 列 假设 : 我 们 
要 考察 总 体 的 某 个 参数 , 它 服从 N (1,o?). 我 们 想 在 0.05 的 a 水平 下 对 这 个 假设 进 


行 检验 . 利 


之 间 的 概率 是 0.95. ] 


换 句 话说 , 如 果 原 假设 为 真 , 羽 


率 是 95%. 


因此 , 在 原 假设 下 , 如 果 某 测量 


差 , 那么 就 认为 该 测量 值 


用 z 表格 可 知 , 如 果 原 假设 成 立 , 那么 该 参数 介 于 /一 1.96c 和 十 1.960 
P 么 在 该 范围 内 产生 一 个 值 的 概 
直 与 均值 之 间 的 距离 超过 了 1.96 个 标准 
b 现 的 概率 小 于 5%. 此 时 , 我 们 会 拒绝 原 假设 . 可 以 把 原 


假设 看 作用 来 建立 一 个 临界 区 域 , 如 果 测 量 值 出 现在 临界 区 域内 , 那么 我 们 就 拒绝 
原 假设 . 在 0.05 的 a 水 平 下 , 如 果 被 检验 的 参数 服从 正 态 分 
与 均值 的 距离 超过 1.96 个 标准 差 的 所 有 范围 , 参见 图 22-1. 


图 22-1 
0.05 


在 本 书 1 


服从 了 


/一 1.96c HK 


双 侧 z 检验 的 临界 区 域 


/AN 
站 


\ 
/ 人 


N41.960 


FP, 当 说 到 显著 性 时 , 指 的 是 统计 学 意义 而 不 是 


E 态 分 布 的 参数 与 
的 a 水 平 下 , 这 就 确 


其 均值 之 间 的 距离 大 于 1.96 个 标 ; 
定 了 双 侧 z 检验 的 临界 区 域 


布 , 那么 临界 区 域 就 是 


侍 差 的 概率 等 于 0.05. 在 


统计 学 意义 3 


不 意味 着 它 


实际 意义 . 某 件 事 具 有 
具有 重大 的 实际 意义 , 或 者 说 , 统计 学 上 的 差异 并 不 一 定 


引发 某 些 实际 行动 . 例如 , 有 一 种 新 研发 的 内 衣 , 其 保暖 性 要 比 以 前 最 好 的 内 衣 好 
2%, 这 一 差异 具有 统计 学 意义 . 但 是 , 这 并 不 意味 着 人 们 会 基于 保暖 性 的 差异 去 选 


择 购 买 新 型 内 衣 , 因为 2% 的 改进 # 
假设 保暖 性 提高 了 30%. 这 可 能 更 具有 实 


没有 那么 显著 . 


者 而 言 . 然而 , 这 个 30% 不 一 定 上 共有 统计 学 意义 , 也 就 是 说 ， 


存在 很 大 差 男 


由 . 我 们 需要 收集 更 多 数据 来 证 明 这 种 差异 而 


样本 容量 与 检验 功效 时 会 提 到 这 一 点 . 


对 于 a 水 平 , 我 们 


因此 , 这 并 没有 实际 意义 . 现在 
际 意 义 , 尤其 是 对 马萨诸塞 州 的 冬季 消费 
我 们 不 清楚 是 否 真 的 

实 存在 , 后 面 章节 中 讨论 


通常 有 很 多 选择 . 最 常见 的 a 水 平 是 0.10、0.05、0.01 和 
0.001. 显然 , a 越 小 , 我 们 观察 到 的 数据 就 越 难以 拒绝 原 假设 . 因此 , 对 a 的 选择 
应 该 依据 不 同 的 考察 目标 而 变化 . 例如 , 如 果 我 们 正在 记 
性 , 那么 可 能 想 要 一 个 非常 低 的 a 水 平 , 以 确保 它 与 大 多 数 外 科 医 生 已 经 习惯 的 旧 
程序 确实 有 很 大 的 不 同 , 从 而 保证 这 种 新 手术 能 被 采用 . 对 于 像 人 们 是 否 喜欢 在 冰 


FE 舍 一 项 新 外 科 手 术 的 有 效 
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激 读 上 撒 糖 霜 这 样 
过 高 还 是 过 低 , 所 以 0.05 通 


的 唯一 a 水 


到 数据 之 后 故意 选择 一 个 允许 我 们 
要 销售 一 布 


司 想 
在 0.01 的 a 


的 事情 , 选 


平 . 最 重要 的 是 ， 


下 


新 药 . 这 种 新 
平 下 却 并 非 如 


水 


AL 
中 绅 


效 , 是 非 


到 区 


3 


的 , 医 


甬 党 
地 吊 


此 应 该 


Nl 


择 0.10 作为 a 水 平 是 合理 的 . 由 于 很 难 判断 a 水 
被 随意 地 看 作 标 准 的 a 水 平 , 这 当然 不 是 我 们 使 用 
我 们 必须 在 观测 数据 之 前 选择 a 水 平 , 以 免 在 观测 
EE 绝 原 假设 的 a 水 平 来 作 次 . 例如 , 一 家 制药 公 
药 在 0.05 的 a 水 平 下 可 能 被 认为 明显 好 于 旧 药 , 但 
此 . 药物 的 功效 , 特别 是 用 于 治疗 致命 疾病 的 药物 功 
E 小 于 0.05 的 a 水 平 下 考虑 . 然而 , 制药 公司 可 以 将 


a 水 平 提 


将 在 下 


高 对 

在 接着 全 
到 的 1.96 被 称 为 临界 值 . 不 难 想到 , 每 
一 节 给 出 对 临界 值 的 准 


| 0.05,， 以 便 说 明 3 
主 下 说 之 前 , 还 有 一 


新 药 具 有 了 明显 的 疗效 , 从 而 大 幅 提高 销售 量 . 
个 术语 不 得 不 提 . 对 于 0.05 的 a 水 平 , 我 们 经 常 提 
个 a 值 都 对 应 着 一 个 不 同 的 临界 值 . 我 们 


有 有 


定义 . 


22.1.3 ”检验 统计 量 


在 


已 知 的 〈 记 但 


以 得 到 检验 统计 量 取 
假设 的 概率 . 一 个 常见 的 检验 统计 
算出 它 服从 的 分 
布 , 就 无 法 评估 得 到 
举 一 个 例子 ， 样 


要 


到 


定 了 显著 性 
一 个 检验 统计 量 . 检验 统计 量 


水 平 之 


ER 


FE, 我 们 从 假定 原 


后 , 就 可 以 对 假设 进行 检验 了 . 


接 下 来 要 做 的 就 是 构造 
中 得 到 的 测量 结果 , 而 且 它 的 分 布 被 假定 为 
始 )， 既然 知道 了 检验 统计 量 的 分 布 , 就 可 


是 从 数据 


泉 假 设 成 并 


个 大 值 


或 较 大 人 


的 概率 ; 这 就 是 我 们 用 来 判断 是 否 拒 绝 原 


的 结果 


) 布 . 这 是 假设 检验 


| 三 玫 1 
是 否 异 第. 


本 均值 应 该 服从 什么 分 布 ? 为 此 , 我 们 回 


本 均值 . 在 确定 了 检验 统计 量 之 后 , 我 们 
最 重要 的 问题 , 如 果 不 知道 检验 统计 量 的 分 


量 是 样 


世上 妇 


忆 一 下 中 心 极限 定 


里 ; 对 于 n 个 独立 同 分 布 的 随机 变量 


n 一 co 时 , 随机 变量 


会 趋向 


是 样本 均值 


是 术 


可 得 


2] 


区 的 期 望 值 


F 服 从 正 态 分 布 . 如 果 每 一 个 X; 都 代表 总 体 
并 且 X; 满足 上 述 条 件 . 于 的 均值 


EY) 


就 是 的 


期 望 值 . 男 外, 球 的 方差 


Var (Y% 人 所 = ve (Pe)]. 


因为 X; 是 相互 独立 的 , 所 以 


ER 


Xi, 设 它们 的 均值 为 / 


人 


方 莽 为 o2, 那么 当 


一 个 成 员 的 度量 , 那么 球 就 
和 方差 是 多 少 ? 由 期 望 的 线性 性 


上 /大 


a 


j= 


下 式 给 出 


(22.1) 
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Var (> | 二 SVar(X) = nVar(X;), 


于 是 , 六 , 的 方差 可 以 简化 成 


o2 


1 
Var (Y%,) 一 二 Var(Xi) 一 


样本 均值 的 方差 有 一 个 奇妙 的 特性 : 随 着 样本 容量 的 增加 , 方差 会 不 断 减 小 . 
要 想 知 道 为 什么 会 这 样 , 可 以 想象 反复 抛掷 一 枚 均匀 硬币 的 场景 (硬币 掷 出 正面 或 
反面 的 概率 相等 ). 如 果 搓 出 正面 的 概率 小 于 45% 或 者 大 于 55%, 那么 就 称 之 为 “不 
寻常 ”的 结果 . 对 于 容量 为 2 的 样本 , 我 们 得 到 一 个 不 寻常 结果 的 概率 是 50%, 这 
是 因为 我 们 只 可 能 掷 出 两 个 正面 (不 寻常 )、 两 个 反面 (不 寻常 ) 或 者 正 反 面 各 一 个 
(寻常 ). 如 果 样 本 容量 为 100 呢 ? 此 时 , 如 果 掷 出 的 正面 少 于 45 个 或 者 超过 55 个 ， 
那么 我 们 就 得 到 了 一 个 不 寻常 的 结果 . 要 做 到 这 一 点 , 有 多 少 种 方法 呢 ? 回顾 一 下 
组 合 学 的 知识 . 掷 出 的 正面 个 数 介 于 45 和 55 之 间 ( 即 没有 得 到 不 寻常 的 结果 ) 的 
方法 一 共有 


E55 /100 

>》， ; ) = 923 796 541 447 310 445 480 620 479 776 

1 一 45 

种 . 另外 , 把 硬币 抛掷 100 次 共有 21% 种 方法 ， 因 此 , 出 现 不 寻常 结果 的 概率 是 1 
减 去 没有 出 现 不 异常 结果 的 概率 ; 


55 
上 1 100 
Prob (不 寻常 结果 ) = > ( ; ) = 0.271. 
YE 


对 于 容量 为 1000 的 样本 , 我 们 可 以 重复 上 面 的 论述 , 从 而 算出 得 到 不 寻常 结 
果 的 概率 为 0.0014. 随 着 样本 容量 的 增加 , 可 能 结果 的 总 数 会 比 得 到 不 寻常 结果 的 
方法 数 增加 得 更 快 . 因此 , 对 于 更 大 的 样本 , 我 们 希望 得 到 更 可 靠 的 真实 平均 值 ( 参 
见 图 22-2). 这 个 例子 说 明了 一 个 非常 普遍 的 原则 : 数据 越 多 越 好 . 不 幸 的 是 , 为 了 
让 准确 性 翻 倍 (将 方差 减 半 ), 你 需要 收集 2 倍 的 数据 . 但 是 在 很 多 实际 情况 下 , 这 
会 付出 昂贵 代价 或 消耗 大 量 时 间 . 

在 图 22-2 中 , 我 们 绘制 了 一 些 模 拟 结果 , 并 在 下 面 给 出 了 生成 它 的 简单 代码 . 


temp = {}; For[n = 100, n <= 1000, n = n + 10,，(* 每 10 个 值 绘制 1 次 *) 


temp = AppendTo[ 

temp, {n, 1 - Sum[Binomial[n, i], {i, .45 n, .55 ny]/2”nj]] 
ListPlot[temp, AxesLabel -> {"Number of flips", "Probability"}, 
PlotRange -> {{100, 1000}, {0, .3}}, 
PlotLabel -> "Probability of getting an unusual result"] 
} 
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Probability of Getting an Unusual Result 


Probability 
0.30 


0.25 


0.20F 


0.15 


0.00 -一 -一 -一 一 -一 一- 一 一 Teeeegesesbe， 


site Number of flips 
200 400 600 800 1000 


图 22-2 ” 随 着 样本 容量 的 增加 (也 就 是 说 , 抛掷 更 多 人 硬币 ), 得 到 “不 寻常 结果 ”的 概率 会 大 大 


降低 . 


容 , 请 参阅 习题 22.8.3 


这 就 是 为 什么 我 们 认为 方差 会 随 着 样本 容量 的 不 断 增加 而 越 来 越 小 . 更 多 内 


一 旦 得 到 了 检验 统计 量 的 分 布 , 就 可 以 马上 做 假设 检验 . 不 妨 设 原 假设 是 “ 随 
机 变量 X 的 均值 等 于 jy”. 如 果 原 假设 成 立 , 那么 对 于 较 大 的 n, 样本 均值 z 应 该 


服从 均值 为 4 


方差 为 o2/n 的 正 态 分 布 . 换言之 , 又 ~ N(c2/m). 于 是 , 检验 统 


计量 如 下 所 示 . 


样本 均值 的 检验 统计 量 
其 方差 是 已 知 的 o?, 并 假设 其 均值 为 由 设 x1,z2,… ,zn 是 从 该 分 布 中 取出 的 
n 个 相互 独立 的 观测 值 . 设 = (zi 十 … 十 zn)/n 是 样本 均值 . 那么 , 观测 到 的 > 
检验 统计 量 的 值 


z 统计 量 : 设 X 是 一 个 服从 正 态 分 布 的 随机 变量 ， 


服从 均值 为 0 


T—H 
Vo2/n 
日 方差 为 1 的 正 态 分 布 (所 以 Z ~ N(0,1)). 如 果 X 不 服从 正 态 


之 一 


分 布 , 而 是 服从 某 个 具有 良好 性 质 的 分 布 , 那么 我 们 会 得 到 一 个 不 错 的 结果 : 当 
n 之 30 时 ,过 = (XI 十 十 Xn)/ 会 近似 于 服从 正 态 分 布 . 方差 是 已 知 的 这 一 点 
非常 重要 , 否则 我 们 就 要 做 更 多 检验 . 


这 个 检验 之 所 以 称 为 z 检验 是 因为 检验 统计 量 服从 正 态 分 布 , 而 这 又 是 因为 
服从 正 态 分 布 的 随机 变量 之 和 仍然 服从 正 态 分 布 . 这 意味 着 正 态 分 布 是 稳定 的 , 我 
们 已 经 在 本 书 中 多 次 谈 到 了 稳定 分 布 的 好 处 . 


对 于 任何 要 测量 的 z 值 , 我 们 都 可 以 利用 标准 正 态 分 布 表 来 找到 检验 统计 量 
远离 0 的 概率 . 


这 个 概率 称 为 p 值 ( 即 概率 值 ). 如 果 p 值 小 于 a 水 平 , 那么 拒绝 原 


假设 并 文 持 备 择 假设 . 这 也 让 我 们 对 临界 值 有 了 更 清楚 的 了 解 . 对 于 给 定 的 假设 检 
验 , 临界 值 满足 下 列 说 法 : 如 果 检 验 统计 量 大 于 临界 值 (在 绝对 值 意义 上 ), 那么 就 


拒绝 原 假设 . 
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现在 终于 可 以 结束 麦当劳 的 例子 了 . 根据 前 面 的 讨论 , 如 果 我 们 接受 原 假设 ， 
并 令 = 45 且 假 设 c = 8 (在 22.3 节 中 , 我 们 还 会 回 到 这 个 假设 ), 那么 在 容量 头 


20 的 样本 中 , 应 该 有 


XX ~ N(45;,82/120). 
这 意味 着 对 于 容量 为 20 的 样本 , 平均 等 待 时 间 应 该 是 45 秒 , 而 标准 差 则 是 1.79 
秒 . 因为 我 们 的 观测 结果 是 z = 48, 所 以 z 值 就 是 (48 一 45) /1.79 = 1.68. 通过 > 
表格 可 以 看 到 检验 统计 量 恰好 大 于 1.68 的 概率 是 0.046, 略 高 于 4%. 由 于 这 个 p 
值 小 于 0.05 的 显著 性 水 平 , 所 以 我 们 拒绝 原 假设 , 并 认为 麦当劳 确实 比 他 们 宣称 的 


速度 要 慢 . 但 是 , 如 果 选 择 0.01 的 a 水 平 , 那么 我 们 会 得 到 一 个 完全 不 同 的 答案 . 


这 个 问题 说 明了 不 同 的 临界 值 是 如 何 影响 我 们 的 判断 的 . 有 些 人 认为 , 研究 人 员 的 


工作 不 是 给 出 结论 , 而 是 报告 p 值 . 
22.1.4” 单 侧 检 验 与 双 侧 检验 
在 上 一 个 例子 中 , 你 可 能 会 想 :“ 为 什么 


只 考察 z 值 大 于 1.68 的 概率 ? 难道 我 
们 不 需要 担心 检验 统计 量 小 于 假设 均值 的 概率 吗 ?” 这 是 迄今 为 止 我 们 有 点 朴 忽 的 
一 个 重要 问题 , 它 阐明 了 单 侧 假设 检验 与 双 侧 假设 检验 之 间 的 关键 区 别 . 麦当劳 的 
例子 前 述 了 单 侧 检 验 的 情形 , 其 中 我 们 感 兴趣 的 是 被 测量 的 参数 是 否 大 于 (或 小 于 ) 
某 个 特定 的 值 . 为 了 看 清 这 一 点 , 我 们 计算 了 检验 统计 量 大 于 或 等 于 已 有 值 的 概率 . 
通过 双 侧 检验 , 我 们 想 看 看 这 个 参数 是 否 与 某 个 给 定 值 有 很 大 的 不 同 , 所 以 要 计算 


检验 统计 量 远离 假设 均值 或 者 远 远 高 于 我 们 


双 侧 z 检验 


HL—1.960 A 人 十 1.96c 


图 22-3 双 侧 z 检验 与 单 侧 z 检验 的 区 


己 有 值 的 概率 . 显然 , 所 测量 的 > 值 取 


决 于 你 正在 做 的 测试 类 型 . 单 侧 检 验 与 双 侧 检验 的 区 别 如 图 22-3 所 示 . 


单 侧 z 检验 


HK H+1.960 
别 . 两 种 检验 的 a 水 平均 为 0.05 


你 会 注意 到 , 单 侧 检 验 的 临界 值 要 比 双 侧 检验 的 临界 值 更 小 (检验 统计 量 与 均 
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值 之 间 的 距离 只 需要 1.64 个 标准 差 , 而 不 是 1.96 个 标准 差 ). 
I 检验 相 比 , 双 侧 检验 需要 
的 证 据 ? 如 果 是 这 样 上 
明 进 行 单 侧 检 验 是 合理 上 
的 速度 更 快 , 因为 如 果真 的 更 快 , 他 们 时 就 那 相 
用 双 例 


检验 的 一 般 性 质 : 
为 什么 双 侧 
呢 ? 问 是 


与 单 仅 


了 ! 但 


三 


I 果 不 和 


是 , 义 


I 检验 需要 更 多 
题 在 于 , 我 们 需要 证 
以 放心 地 假设 他 们 不 会 比 宣传 
排除 这 种 可 


/ = 43, 那么 检验 统计 量 就 变 成 了 (48 一 43)/1.79 = 2.79 一 一 比 以 前 
任意 一 个 小 于 45 的 均值 , 我 们 会 有 更 高 的 z 测量 值 . 
况 . 如 果 当 y= 45 时 , 我 们 可 以 拒绝 原 假设 , 那 
都 可 以 拒绝 原 假设 . 这 是 单 侧 检 验 上 

既然 已 经 给 出 了 假设 检验 的 框架 , 接 下 来 我 


| 


入， 在 


麦当劳 的 例子 


这 是 单 侧 检 验 与 双 侧 
多 的 证 据 . 
的 话 , 为 什么 不 能 只 用 单 俱 


| 检验 


能 性 , 那么 就 需要 使 


么 对 于 任何 
的 一 个 便利 属性 : 你 只 需要 考察 最 极端 
门 看 一 些 例子 . 


因此 , A = 45 


Ph, 我 们 可 
宣传 


最 后 就 单 侧 检 验 做 一 点 说 明 . 在 麦当劳 的 例子 中 , 原 假设 是 jy < 枉 ;: 但 在 做 检 


验 时 , 我 们 只 令 A = 45. 为 什么 不 需要 担心 均值 为 43 的 可 能 性 呢 ? 好 吧 , 假设 令 


大 ] 


! 对 于 


小 于 4 的 


例子 : 假设 从 
想 检 验 它们 的 寿命 是 否 


正在 测量 灯泡 的 使 
与 2000 小 时 


书 寿 命 ， 并 


平均 使 用 寿命 是 2000 小 时 ”这 一 假设 吗 ? 


解答 : 


is, 这 是 一 个 双 侧 检验 ， 


我 们 已 经 有 了 原 假设 , 即 yj = 2000. 因 


Hs: wh A 2000. 


能 性 . 现在 我 们 来 计算 检验 统计 旱 , 也 就 是 


要 小 心 ! 人 们 经 党 


因为 没有 理由 不 考虑 灯泡 使 月 


此 , 备 择 假设 


差 是 100, 所 以 z 值 是 1/2. 这 个 值 太 小 了 , 所 以 不 能 断定 均值 
误 的 标准 差 ! 100 小 时 是 只 包含 一 个 灯 
会 得 到 


使 用 了 错 
灯泡 的 样本 , 你 应 该 

22.36 小 时 . 因此 , > 值 是 
所 以 p 值 就 等 于 检验 统 i 


说 服 力 的 证 据 , 表明 了 真 ] 

例子 : 假设 一 家 汽车 保险 
新 市 场 . 在 波士顿 , 某 一 年 提 昌 
述 , 其 中 成 功 ( 即 司机 提 
岗 投 保 的 10000 名 司机 


发 


a 


(2050 — 2000) /22.3 
量 大 于 2.24 或 小 于 
E 的 ] 


了 
a 


泡 的 样 


已 知 标准 


本 的 标 


崩 时 间 少 于 2000 


是 最 困 x 
段 设 1 


差 为 o = 100 4 
有 很 大 差别 .在 包含 20 个 灯泡 的 随机 样本 中 ， 
你 发 现 它们 的 平均 使 用 寿命 是 2050 小 时 . 在 0.05 的 a 水 平 下 , 你 会 拒绝 “灯泡 的 


全 的 情 
均值 , 就 


= 


se 


上 


小 时 . 


小 时 的 可 


下 准 


更 可 靠 的 均值 


,而 1 


均值 不 是 2000 小 时 . 


E 确 的 标准 
6 ~ 2.24. 
一 2.24 


差 是 c/v\ = 1 


_ 观测 均值 - 假设 均值 
标准 差 : 
错误 地 说 :“ 观 测 均 值 是 2050, 假设 均值 是 2000, 又 因为 标准 


有 差别 . ”然而 , 他 们 
差 . 对 于 包含 20 个 


00/V20 ~ 


于 我 们 使 用 的 是 双 侧 检验 ， 


的 概率 , 即 0.025. 这 是 非常 有 


公司 最 近 从 波士顿 搬 到 
索赔 的 保单 持 有 人 的 百分比 可 以 用 一 
索赔) 的 概率 为 ps = 0.25. 在 西 雅 
PF 有 2300 人 提出 了 索赔 . 在 0.05 的 a 水 平 下 , 检验 在 西 
E 图 投保 的 司机 提出 索赔 的 概率 , 记 作 ps, 是 否 小 于 0.25. 


了 西 


雅 图 , 并 试 


图 了 解 他 们 的 
二 项 分 布 来 
图 的 第 一 年 , 该 公司 


解答 : 


下 : 


0.25 是 否 成 立 


备 择 假设 为 


在 这 种 


这 是 
波士顿 司机 发 生 


有 使 用 


le de ee 


情况 下 , 原 假设 与 备 择 假 设 分 别 是 什么 ? 
7, 所 以 原 假设 为 


Ho: ps 0.25, 


Hi,: ps < 0.25. 


而 次 


| 么 不 考虑 
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因为 我 们 想 检 验 ps。 < 


西雅图 


司机 比 


多 事故 的 可 能 性 . 或 许 


又 或 者 因为 西医 
验 是 


图 人 口 密度 较 小 , 所 以 我 


合理 的 . 一 旦 有 了 假设 , 我 们 就 可 以 按照 通 稼 


是 


谨慎 地 证 明 为 人 
因为 以 前 的 研究 表 


明了 情况 就 是 这 样 ， 


门 预测 事故 发 生 会 减少 . 


真 , 并 令 ps = 0.25. 在 这 


较 大 的 N, 容量 为 N 
V Np( (1 p) 的 正 态 


分 布 来 很 好 二 


种 情况 下 ， 
中 规模 为 10 000, 成 功 概 率 为 0.25. 但 是 , 我 们 可 以 
日 成 功 概 率 为 p 的 二 项 分 布 可 以 
也 逼近 (这 是 中 心 极 限定 理 的 一 个 特例 . 
| 


30 时 , NN 已 经 很 大 了 . 


似 服从 均值 
分 布 . 
既然 知道 


由 于 
二 项 分 布 . 因此 , 如 果 ps = 0.25, 那么 在 
为 10 000: 0.25 = 2500 


西雅图 


这 里 是 10 000, 所 以 我 介 
E 10 000 名 司机 中 


了 提出 索赔 的 司机 人 数 应 该 服从 什么 检 
检验 统计 量 了 . 我 们 已 经 证 明了 在 原 假设 下 , 提出 索赔 的 司机 人 数 应 该 


EANY 


巴 问 题 变 得 更 简单 一 


该 用 二 项 分 布 


] 可 以 放 ， 


不 妨 设 单 侧 检 
的 做 法 进行 下 去 . 假定 原 假 设 为 
的 索赔 数量 


来 描述 , 其 
些 . 对 于 


均值 为 Np 


标准 差 为 


态 分 布 . 现在 有 2300 名 司机 提出 了 索赔 


4.62. 


的 分 布 , 接 下 来 就 可 以 计算 
服从 均值 
因此 , 检验 统 


2500 且 标 准 差 为 43.3 的 正 ; 
计量 为 2300 — 2500 
43.3 
这 个 检验 统计 量 应 该 服从 标准 正 态 分 布 . 
最 后 一 


心地 用 正 态 分 布 来 替换 
提出 索赔 的 人 数 应 该 近 
且 标 准 差 为 V10 000.0.25.0.75 、 43.3 的 正 态 


在 18.3 节 


| 


为 


步 是 计算 p 值 , 即 检验 统计 量 远离 我 们 已 有 量 的 概率 . 因为 要 检验 ps。 < 


0.25 是 否 成 立 , 所 以 我 们 只 需要 求 出 检验 统计 量 小 于 -4.62 的 概率 , 即 更 (一 4.62) 沪 


1.92 x 10-6 (这 里 的 BB 是 


a 水 平 , 所 以 我 们 拒绝 原 假 


的 概率 小 于 0.25. 


标准 
设 并 给 


正 态 分 布 


在 假设 检验 中 , 需要 


证 明 检 验 统 计量 


结论: 在 西 雅 


图 投 


的 分 布 是 合 型 


E 的 . 在 对 


样本 均值 


的 累积 分 布 函数 ). 这 个 概率 远 小 于 0.05 的 
保 的 司机 在 某 一 年 


是 出 索赔 


做 假设 检 


验 时 , 我 们 经 常 利用 中 心 极限 定理 (CLT) 来 说 明 对 是 服从 正 态 分 布 的 . 然而 , 我 


们 需要 并 


慎 地 使 用 这 种 论证 


方法 . 如 果 基本 分 布 是 “好 的 ”, 并 | 


样本 


容量 很 大 , 那 


么 可 以 认为 


几 个 数据 点 的 性 


是 服从 正 态 分 布 的 . 但 


4 况 , 那么 在 使 


征 


CLT 时 就 要 非常 小 心 (也 可 


如 果 你 要 处 理 一 个 奇怪 


的 分 布 或 者 只 有 
能 有 一 个 柯 西 分 布 , 其 
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均值 根本 不 存在 ). 换 一 利 


说 明 你 收集 的 数据 为 什么 会 服从 正 态 分 布 . 


的 例子 中 , 我 们 实际 上 使 用 了 
不 正确 的 , 我 们 将 在 本 章 后 面 讨论 如 何 解决 这 个 问题 . 


四 


假定 原 假设 


/人 


样本 方差， 


22.2 p 值 


说 法 : 如 果 想 使 用 z 检验 , 你 就 要 提供 一 个 很 好 的 理 


来 


关于 z 检验 , 需要 注意 的 最 后 一 点 是 , 要 假设 对 方差 有 全 面 的 了 解 . 在 麦当劳 


首 把 它 看 作 真 实 方差 . 从 技术 角度 看 , 这 是 


出 了 一 种 假设 检验 法 . 在 假设 检验 的 框架 中 , 最 习 


地 描述 > 值 ， 


成 立 , p 值 让 我 们 了 解 到 收集 的 数据 远离 已 有 值 的 概率 . 本 
并 提醒 人 们 避免 对 它 产 生 一 些 误解 . 


EE 要 的 度量 是 p 值 . 


= 


节 则 更 直观 


本 节 要 点 


。 对 相 


同 数据 的 不 同 检 


验 可 以 产生 不 同 的 p 值 . 


。7 值 不 是 原 假设 成 立 的 概率 . 


。7 值 是 一 个 条 件 概率 : 在 原 假设 成 立 的 前 提 下 , 收集 到 已 有 数据 的 概率 . 
。7 值 与 上 下 文 有 关 . 


22.2.1 非凡 的 主张 与 p 值 


正如 我 1 


择 : 可 以 得 


事件 是 不 太 可 外 


门 在 22.1 节 中 所 述 , 在 原 假设 成 立 的 前 提 下 , p 值 
的 事件 偶然 发 生 的 可 能 性 . 如 果 观 察 到 一 个 > 值 非常 小 的 事件 


结论 , 即 看 到 了 


个 罕见 事件 也 可 以 认为 在 


我 们 想 强 调 的 一 点 是 , p 


下 , 一 位 音乐 家 走 到 你 面 
符 ). 为 了 检验 这 一 点 , 假设 你 为 他 演奏 了 8 个 不 同 的 音符 , 人 


前 , 告 1 


只 要 


诉 你 他 有 绝对 音 感 ( 


个 音符 . 你 会 相信 他 的 话 吗 ? 


力 , 而 且 如 果 他 是 猜测 的 话 , 能 猜 对 所 有 8 个 音符 的 概率 


男人 走 到 你 面 
也 的 说 法 ,你 证 1 
在 写 下 8 个 音符 后 ， 


验证 
答 


bh 


前 , 说 人 


只 要 仔细 想 一 想 就 可 以 知道 你 下 一 
也 写 下 他 认为 你 将 要 演奏 
你 将 核对 列表 . 假设 他 把 8 个 音符 者 


j 来 衡量 我 们 观察 到 


, 那么 我 们 有 两 种 选 
段 设 前 提 下 , 我 们 看 到 的 
发生 的 , 所 以 假设 很 可 能 是 错误 的 ( 即 拒绝 原 假设 ). 

值 的 说 服 力 取决 于 上 下 文 . 为 什么 这 么 说 呢 ? 想象 一 
听 一 听 , 就 能 辨认 出 任何 音 


pb 六 


E 确 地 识别 了 所 有 8 


让 T 台 EC 人 
可 能 会 


为 训练 有 素 的 


上 “时 
-hh 


相信 他 , 因 


上 
砂 


音乐 家 都 有 
小 . 现在 人 
要 演奏 


不 错 的 听 
段 设 有 一 个 


什么 音符 . 为 了 


Ar 


的 音符 , 然后 自 


1 与 


真正 演奏 的 音 


号 对 了 .你 会 相信 他 


的 话 吗 ? 虽然 我 们 有 与 第 一 个 例子 相同 的 证 据 , 但 你 可 能 会 犹 驳 是 否 相 信 这 个 人 能 


够 预测 你 


的 行为 (你 可 能 希望 得 到 更 多 的 数据 ), 这 仅仅 是 


因 


为 他 的 


断言 太 令 人 难 


以 置信 . 所 以 , 即使 有 相同 的 证 据 (也 就 是 说 , 当 把 两 种 情况 的 原 假 设 都 定义 为 : 这 


个 人 是 猜测 的 , 那么 这 两 种 人 


部 下 的 p 


由 是 相同 的 ), 我 们 也 会 更 倾 


向 于 相信 其 中 
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一 个 p 值 而 非 男 外 一 个 . 正如 卡尔 ”了 萨 根 曾经 所 说 的 ,“ 非 凡 的 主张 需要 非凡 的 证 
据 ” . 
22.2.2 ”大 的 p 值 


假设 你 想 检 验 一 枚 硬币 是 否 均匀 ( 即 掷 出 正面 和 反面 的 概率 相等 )， 抛掷 便 币 
当 把 20 次 之 后 , 你 看 到 了 12 次 正面 . 如 果 原 假设 为 “硬币 是 均匀 的 ”, 那么 p 值 
是 多 少 ? 假设 硬币 是 均匀 的 , 那么 抛掷 硬币 五 次 , 正面 出 现 的 次 数 应 该 服从 二 项 分 


布 : 
1 /20 
Pr(H = 7x) = 高 (4) 
掷 出 的 正面 (或 反面 ) 不 少 于 12 次 的 概率 , 即 p 值 , 等 于 


8 20 
有 > 全 + > , ~ 0.503. 
k=0 三 12 

这 个 p 值 比 我 们 之 前 看 到 的 都 要 大 , 所 以 我 们 肯定 不 能 用 这 个 数据 来 拒绝 原 
假设 . 这 意味 着 什么 呢 ? 我 们 已 经 证 明了 硬币 是 均匀 的 吗 ? 当然 不 是 ! 这 个 数据 实 
际 上 与 扼 出 正面 的 概率 是 0.6 的 假设 更 加 一 致 . 但 是 , 这 个 数据 与 我 们 所 期 望 的 均 
匀 硬 币 并 不 相符 . 既然 不 能 说 已 经 证 明了 硬币 是 均匀 的 , 那 就 说 我 们 无 法 拒绝 硬币 
是 均匀 的 原 假设 . 这 是 统计 学 语言 的 一 个 重要 部 分 我 们 从 不 “接受 ”任何 假 
设 , 只 拒绝 或 者 无 法 拒绝 假设 . (这 类 似 于 陪审 团 裁定 “无 罪 ” 判 决 而 非 “ 无 率 ” 判 
决 .) 硬币 可 能 是 不 均匀 的 , 如 果 有 更 多 的 数据 , 我 们 或 许 会 看 到 更 强 的 偏差 . 然而 ， 
从 我 们 观察 到 的 样本 来 看 , 没有 足够 令 人 信服 的 证 据 来 修改 我 们 最 初 的 主张 . 
22.2.3 ”关于 p 值 的 误解 

关于 p 值 还 有 最 后 一 点 要 说 明 : p 值 不 是 原 假设 成 立 的 概率 . 这 是 一 个 很 常见 
的 错误 , 也 是 个 合理 的 错误 . 考虑 一 下 硬币 的 例子 : 硬币 要 么 是 均匀 的 , 要 么 是 不 均 
匀 的 硬币 的 状态 没有 随机 性 . 在 这 种 情况 下 , 讨论 原 假 设 成 立 的 概率 是 没有 
意义 的 . 然而 , p 值 仍然 是 有 意义 的 : 它 是 在 原 假设 成 立 的 前 提 下 , 收集 到 已 有 证 据 
的 条 件 概 率 , 而 不 是 在 已 经 收集 了 数据 的 前 提 下 , 原 假设 成 立 的 概率 . 

例子 : 你 是 名 办 公 室 经 理 , 购买 了 20 台 全 新 的 影印 机 . 制造 商 告诉 你 , 在 一 年 
内 , 有 一 台 机 器 出 现 故障 的 概率 是 pun = 0.03. 在 使 用 的 第 一 年 里 , 有 两 台 影 印 机 
发 生 了 故障 . 现在 , 你 是 否 相 信和 制造 商 告诉 你 的 ppp 值 ? 当 a 水 平 是 多 少时 , 你 会 
选择 不 相信 和 制造 商 的 说 法 ? 

解答 : 这 是 关于 利用 二 项 分 布 进行 假设 检验 的 一 个 很 好 的 介绍 , 因为 我 们 的 
样本 太 小 从 而 无 法 使 用 正 态 分 布 来 近似 . 为 了 使 用 二 项 分 布 , 必须 假设 每 台 影 印 机 
是 否 出 现 故障 都 与 其 他 影印 机 相互 独立 . 和 往常 一 样 , 我 们 首先 给 出 原 假 设 与 备 择 
假设 . 我 们 怀疑 机 器 出 故障 的 频率 大 于 0.03, 所 以 有 如 下 假设 : 


©O 
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Ho: ppn < 0.03, His: ppn > 0.03. (22.2) 
假定 原 假设 成 立 , 并 令 pph = 0.03. 在 这 种 情况 下 , 一 年 内 有 台 机 器 出 现 故 障 的 


Prob(n 台 机 器 故障 ) = 和 ) (0.03)"(1 003 
使 用 二 项 分 布 进行 假设 检验 的 美妙 之 处 在 于 我 们 已 经 知道 了 检验 统计 量 一 
它 就 是 2， 我 们 的 p 值 就 是 在 某 一 年 有 两 台 或 更 多 台 机 器 发 生 故 障 的 概率 . 为 了 
求 出 这 个 概率 , 可 以 把 两 台 机 器 故障 的 概率 加 上 三 台 机 器 故障 的 概率 .……… 这 样 
直 加 下 去 我 们 还 可 能 会 注意 到 
Prob( 两 台 或 更 多 台 机 器 出 现 故 障 ) = 1 一 Prob( 零 或 一 台 机 器 出 现 故障 )， 


这 个 概率 就 是 1 一 ((0.97)20 + 20 .0.03 . (0.97)19) s 0.12. 这 不 是 个 非常 有 说 服 力 的 
p 值 . 没 错 , 一 年 中 有 两 台 影 印 机 出 现 故 障 是 很 少见 的 , 但 这 种 情况 也 没有 罕见 到 让 
你 开始 怀疑 制造 商 在 骗 你 . 为 了 能 够 拒绝 原 假设 , 你 的 a 水 平 必须 至 少 为 0.12, 但 
这 个 值 太 大 了 , 以 至 于 不 能 被 任何 正式 场合 接受 . 

例子 : 从 1997 年 到 2006 年 , 哈 特 福 德 市 的 流感 病例 数 (每 10 000 人 ) 可 以 用 
入 = 350 的 泊 松 分 布 来 模拟 . 提醒 一 下 , 这 意味 着 在 某 个 特定 年 份 , 看 到 个 流感 
病例 的 概率 是 


网 一 350 . 350R 
Prob(k 个 流感 病例 ) = -一 站 一 


从 2007 年 开始 , 通过 了 一 项 增加 注射 流感 疫苗 数量 的 法 案 . 在 此 后 的 3 年 中 , 每 
10 000 人 的 流感 病例 数 分 别 为 330, 320 和 325. 假设 新 法 案 是 影响 流感 率 的 唯一 有 
意义 的 因素 (这 是 一 个 很 大 的 假设 ), 你 认为 增加 流感 疫苗 的 投入 能 有 助 于 减少 哈 
特 福 德 市 的 流感 病例 数 吗 ? 

解答 : 不 妨 设 原 假设 为 “法 案 没 有 发 挥 任何 作用 , 过 去 几 年 较 低 的 病例 总 数 只 
不 过 是 一 种 巧合 ”. 在 这 种 情况 下 , 流感 病例 的 数量 用 入 = 350 的 泊 松 分 布 来 模拟 . 
在 这 三 年 的 时 间 里 , 流感 病例 数 应 该 服从 什么 样 的 分 布 ? 正如 我 们 在 19.1 节 中 看 到 
的 , 如 果 X 服从 参数 为 Ai 的 泊 松 分 布 , Y 服从 参数 为 和 的 泊 松 分 布 , 那么 和 十 立 
就 服从 参数 为 Ai + Xa 的 泊 松 分 布 ( 换 名 话说 , 我 们 又 得 到 了 一 个 稳定 分 布 ). 如 果 
有 三 个 服从 泊 松 分 布 的 随机 变量 , 那么 它们 的 和 也 会 服从 泊 松 分 布 , 并 且 该 分 布 的 
参数 等 于 前 三 个 分 布 的 参数 之 和 . 

我 们 看 到 , 在 这 三 年 时 间 里 , 哈 特 福 德 市 的 流感 病例 数 应 该 用 一 个 参数 为 和 = 
350 十 350 十 350 = 1050 的 泊 松 分 布 来 模拟 . 在 过 去 的 3 年 里 , 已 经 出 现 了 975 例 流 
感 . 出 现 的 流感 病例 数 小 于 或 等 于 这 个 值 的 概率 是 

SC e-350 .350" 
nl! 


ll 


~ 0.010, 
n=0 


于 是 p 值 为 0.01. 这 足以 说 明 法 案 是 有 用 的 . 
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注 我 们 提 到 可 以 把 流感 病例 数 的 所 有 变化 都 归 因 于 这 项 新 法 案 , 这 是 一 个 很 
大 的 假设 . 这 是 因为 还 存在 许多 其 他 因素 可 以 导致 流感 发 病 率 降低 : 也许 哈 特 福 
德 市 最 近 推 出 的 一 个 公共 卫生 项 目 增加 了 经 常 洗手 的 人 数 , 这 有 助 于 减少 细菌 的 传 
播 ; 也 许 反常 的 暖冬 使 得 人 们 待 在 室内 的 时 间 减 少 , 因此 人 们 不 太 可 能 把 细菌 传染 
给 其 他 人 . 对 于 这 样 的 问题 , 认识 到 你 所 做 的 假设 是 很 重要 的 , 并 且 要 考虑 到 你 可 
能 遗漏 的 潜在 因素 . 这 一 点 之 所 以 重要 有 两 方面 的 原因 : 它 可 以 让 你 认识 到 你 建立 
的 模型 有 哪些 缺点 ， (更 重要 的 是 ) 还 可 以 引导 你 转向 重要 数据 . 例如, 如 果 我 们 认 
为 天 气 因素 会 对 哈 特 福 德 市 的 流感 病例 产生 影响 , 那么 或 许可 以 看 看 其 他 有 暖冬 但 
没有 通过 流感 疫苗 法 案 的 城镇 是 何 情况 . 


22.3 + 检 验 


在 22.1 节 的 结尾 , 我 们 提 到 了 > 检验 的 一 个 潜在 问题 : 假设 对 方差 有 全 面 的 
了 解 . 但 是 , 我 们 真正 知道 方差 的 例子 却 很 少 ， 大 多 数 时 候 , 我 们 都 是 利用 数据 本 
身 来 估算 方差 . 本 节 将 讨论 如 何 找到 一 个 精确 的 方差 估计 量 , 以 及 如 何在 假设 检验 
中 使 用 这 个 估计 量 . 


本 节 要 点 
。z 检验 假设 完全 了 解 方 差 , 但 在 很 多 情况 下 我 们 做 不 到 这 一 点 . 
。 我们 可 以 从 数据 中 得 到 方差 的 估计 值 , 并 用 它 来 代替 实际 方差. 
。 利 用 样本 方差 来 改变 检验 统计 量 的 分 布 . 


22.3.1 ”估算 样本 方差 

当 我 们 收集 总 体 参数 的 相关 数据 时 , 如 果 不 知 道 有 关 方 差 的 任何 信息 , 那么 估 
算 方差 最 直接 的 方法 是 按照 下 列 方式 计算 样本 方差 : 与 之 前 一 样 , 求 出 样本 均值 
(z= 二 (zi 十 … 十 zn)/n), 然后 把 样本 方差 s? 取 作 


Nn 


1 1 之 n 
2 . ,二 2 -2 
SW = 7) i 


3 一 十 

这 看 起 来 非常 像 常规 的 方差 公式 , 不 同 之 处 在 于 这 里 的 分 母 是 n 一 1. 这 基于 
统计 学 中 的 一 个 重要 概念 , 即 所 请 的 自由 度 . 对 于 任意 一 个 给 定 的 估计 ， 度 是 
做 出 该 估计 所 需要 的 独立 观测 值 的 个 数 . 假设 我 们 知道 波士顿 8 月 份 的 平均 高 温 
是 80°F", 现在 想 了 解 温度 的 方差 是 多 少 . 如 果 第 二 天 的 最 高 温 为 85°F, 那么 可 以 
估计 方差 是 (85 一 80)? = 25 (当然 , 方差 的 单位 是 华氏 度 ”). 像 通常 情况 那样 , 假设 
我 们 事先 并 不 知道 均值 . 那么 , 如 果 测 量 的 最 高 温 是 85°F, 就 可 以 把 这 个 值 当 作 平 


Q@ 80°F 约 为 27°C. 一 一 编者 注 


582 第 22 章 假设 检验 


均 温 度 的 估计 值 . 但 是 , 我 们 得 不 到 与 方差 有 关 的 任何 信息 , 因为 这 里 没有 偏离 雹 
值 的 量 . 当 把 上 述 公式 用 于 考察 一 个 容量 为 1 的 样本 时 , 会 发 生 什么 呢 ? 你 会 得 到 
0/0 一 一 即使 方程 式 本 身 也 知道 不 应 在 此 例 中 使 用 它 ! 

如 果 再 次 观察 并 发 现 最 高 温 是 88°F, 那么 现在 能 得 到 什么 呢 ? 此 时 的 样本 均 
值 是 86.5°F, 并 且 可 以 估算 样本 方差 . 但 是 , 由 于 我 们 要 利用 样本 均值 来 估算 方差 ， 
所 以 这 两 个 观测 值 对 方差 的 影响 并 不 是 相互 独立 的 : 一 旦 知道 了 均值 和 其 中 一 个 
最 高 温 , 你 自然 就 知道 了 另 一 个 最 高 温 . 所 以 , 只 有 一 个 观测 结果 会 对 样本 方差 产 
生 影响 . 一 般 来 说 , 这 里 使 用 n 一 1 是 因为 我 们 想 知 道 , 在 样本 中 , 观测 值 会 对 方差 
产生 影响 的 变量 有 多 少 个 . 

注 关于 应 该 使 用 n 一 1 而 不 是 n 的 另 一 个 可 信 说 法 是 , s? 是 o? 的 无 偏 估计 
量 . 这 意味 着 EE[s?] = 0?, 所 以 平均 来 看 我 们 的 预测 是 不 错 的 . 

22.3.2 ”从 z 检验 到 t 检验 


有 了 样本 方差, 我 们 就 可 以 用 前 面 提 到 的 > 检验 来 解决 问题 了 . 回想 一 下 , 当 
进行 > 检验 时 , 我 们 找到 了 一 个 检验 统计 量 元 它 服从 均值 为 1 目 方差 为 va/m 的 
正 态 分 布 (在 原 假设 下 ). 据 此 , 我 们 可 以 构造 服从 标准 正 态 分 布 的 检验 统计 量 

(sp) /Vem. 

如 果 不 知道 cz 呢 ? 那么 用 估计 量 s? 来 代替 它 似乎 是 合理 的 ， 也 就 是 说 , 把 分 母 
写成 V5 而 不 是 V5375. 这 会 对 检验 统计 量 的 分 布 产生 什么 样 的 影响 呢 ? 由 于 
加 = jh 且 Els3] = 02, 所 以 这 个 量 应 该 接近 于 > 统计 量 . 但 是 , 其 分 布 应 该 比 正 
态 分 布 更 加 分 散 一 些 . 这 是 为 什么 呢 ? 当 已 知 o? 时 , 随机 性 只 来 源 于 一 个 量 , 即 x 
现在 , 我 们 有 两 个 随机 变动 的 量 (z 和 s?), 所 以 分 布 不 应 该 像 以 前 那样 局 部 化 . 换 
句 话说: 现在 不 应 该 有 更 好 的 估计 , 因为 我 们 知道 的 更 少 了 ! 事实 上 , 这 个 检验 统 
计量 确实 服从 一 个 关于 0 对 称 的 分 布 , 即 所 请 的 t 分 布 


t 分 布 ， + 分 布 是 一 个 分 布 族 , 其 参数 是 自由 度 . 设 X1,… , X 是 相互 独立 且 均 
服从 标准 正 态 分布 的 随机 变量 , 并 设 82 是 样本 方差 随机 变量 , 那么 /(Su/v 合 
的 分 布 称 为 自由 度 为 n 一 1 的 分 布 , 记 作 荆 _1. 对 于 自由 度 为 ”的 守 分 布 , 其 
概率 密度 函数 的 解析 表达 式 为 


vt+1 
2 


rp (1 2) 
VvAL(v/2) Jv 

更 一 般 地 , 如 果 基 本 分 布 被 推测 为 均值 是 A ( 且 方 差 是 未 知 的 o?) 的 正 态 分 布 ， 

那么 检验 统计 量 为 


ms by 
注意 : 方差 不 能 出 现在 检验 统计 量 的 定义 中 , 因为 它 是 未 知 的 , 所 以 不 可 用 ! 
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t 分 布 与 正 态 分 布 非常 相似 , 如 图 22-4 所 示 . 实际 上 , 当 n 趋向 于 无 穷 大 时 ， 
t 分 布 趋 向 于 正 态 分 布 . 这 让 我 们 有 了 一 个 直观 认识 : 在 已 知 基本 正 态 分 布 的 情况 
让, 可 以 使 用 tt 分布 , 但 需要 估算 方差 . 当 样 本 容量 很 大 时 , 我 们 对 方差 的 估计 会 变 
得 越 来 越 精 确 , 并 且 不 需要 担心 估计 的 不 确定 性 . 更 正式 地 说 , 利用 


我 们 看 到 


二 ZN 一 1/2 = 
2 3 2 2 
lim @ + 5) 一 ( lim @ 十 二 ) lim @ 十 5) = er /2. 
7 一 oo v 了 一 co 7/ 7 一 co Lv 


3 | 2 1 0 下 2 3 


i i 


注意 , 当 自 由 度 为 30 时 ,上 分 布 就 可 以 很 好 地 逼近 正 态 


图 22-4 ”自由 度 分 别 为 1,3,9 和 20 的 +t 分布 (从 最 低 到 最 高 ). 最 高 的 曲线 是 标准 正 态 分 布 . 


一 旦 知道 了 检验 统计 量 是 如 何 分布 的 , t 检验 接 下 来 的 流程 就 与 z 检验 完全 相 


同 了 . 我 们 给 出 原 假设 与 备 择 假设 , 计算 检验 统计 量 , 并 找到 相应 的 p 值 . 从 直观 上 
看 , 两 者 也 是 完全 一 样 的 : 如 果 


和 
‘7 VaR 
服从 t 分 布 , 那么 对 于 6 的 任何 一 个 值 , 我 们 都 可 以 计算 出 检验 统计 量 取 较 大 值 的 
可 能 性 . 如 果 这 个 概率 足够 小 , 我 们 就 拒绝 原 假设 . 
既然 已 经 知道 了 t 检验 的 形式 , 我 们 可 以 回 到 本 章 开头 关于 麦当劳 的 例子 . 现 
在 能 够 更 准确 地 使 用 样本 方差 s = 64, 而 不 是 像 之 前 那样 使 用 o? = 48, 于 是 有 
"i 1.68, 


V64720 
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这 与 之 前 得 到 的 结果 相同 . 两 种 做 法 的 唯一 区 别 是 , 现在 我 们 希望 检验 统计 量 服从 
自由 度 为 19 的 t 分 布 . 实际 上 , 在 0.05 的 a 水平 下 , 这 个 分 布 的 边界 值 是 t= 1.73， 
所 以 在 5% 的 显著 性 水 平 下 , 我 们 无 法 拒绝 / = 45 的 原 假设 . 考虑 到 之 前 有 多 么 
接近 5% 的 显著 性 水 平 , 略微 不 同 的 检验 方法 会 给 出 不 同 的 结果 也 就 不 足 为 奇 了 ， 
但 这 可 能 会 令 人 担忧 ! 
发 生 了 什么 ? 为 什么 我 们 可 以 使 用 z 检验 拒绝 原 假设 , 但 在 使 用 t 检验 时 却 不 
能 ? 这 里 有 两 个 因素 : 我 们 并 不 像 自己 认为 的 那样 拥有 充足 的 信息 , 并 有 旦 显著 性 水 
平 会 影响 边界 值 . 在 第 一 次 进行 z 检验 时 , 我 们 声称 知道 标准 差 是 8 秒 . 但 在 使 用 
t 检验 时 , 我 们 不 得 不 承认 只 估算 了 方差 . 正 因 如 此 , 接 下 来 的 每 一 次 估计 都 变 得 更 
加 不 确定 . 另 一 个 问题 是 我 们 遇 到 了 5% 的 显著 性 水 平 . 即便 使 用 t 检验 , p 值 仍 
然 是 0.055 一 一 这 非常 有 力 地 表明 了 麦当劳 比 他 们 声称 的 速度 要 慢 , 但 恰好 超过 了 
边界 值 . 正如 我 们 上 面 所 说 的 , 出 于 这 个 原因 , 很 多 研究 人 员 放 弃 拒绝 或 无 法 拒绝 
假设 , 只 能 进行 简单 的 分 析 并 给 出 p 值 . 
例子 : 假设 你 在 自家 花园 里 种 植 了 西红柿 . 在 过 去 的 几 年 里 , 你 做 了 一 些 观察 
并 发 现 你 种 植 的 西红柿 的 重量 几乎 始终 服从 平均 重量 为 4 内 司 的 正 态 分 布 . 但 是 ， 
你 最 近 看 到 了 一 种 新 型 肥料 的 广告 , 它 声称 可 以 增加 农产品 的 大 小 ， 你 突 发 奇想 ， 
决定 试 一 试 这 种 肥料 . 在 你 种 植 的 下 一 批 西红柿 中 , 有 2 个 3 次 司 的 西红柿 , 4 个 
4 发 司 的 西红柿 , 以 及 6 个 5 淮 司 西红柿 . 据 此 , 你 能 否 断 言 该 肥料 会 增加 产量 ? 
解答 : 因为 我 们 对 肥料 能 否 增加 产量 感 兴 趣 , 所 以 原 假设 就 是 肥料 没有 (或 者 
可 能 有 负面 的 ) 影响 . 用 / 表示 施肥 后 西红柿 的 平均 大 小 , 我 们 有 
Ho: 1 < 4, Ha: /> 4. (22.3) 


与 之 前 一 样 , 假设 原 假 设 成 立 , 并 令 1 = 4. 为 了 计算 检验 统计 量 , 我 们 需要 样 
本 均值 和 样本 方差 . 不 难看 出 , 样本 均值 为 
2.3 十 4.4 十 6.5 


12 ， 


T 


样本 方差 是 
2 二 (2 : (3 4.33)? EA (4 4.33)2 -6. (5 4.33)?) ~ 0.61. 
因此 , 检验 统计 量 为 


元 一 433 一 4 
于 = gs ~ 1.48. 

这 个 检验 统计 量 是 如 何 分 布 的 ? 由 于 我 们 使 用 的 是 样本 方差 , 所 以 第 一 个 猜想 
是 t 分布 . 但 是 , 要 使 用 t 分布, 我 们 需要 一 个 基本 的 正 态 分 布 . 现在 是 这 样 的 情况 
吗 ? 我 们 说 过 西红柿 的 重量 几乎 服从 正 态 分 布 , 所 以 由 中 心 极限 定理 可 知 , 从 这 个 


Q@ 1 赂 司 约 等 于 28.35 克 . 一 一 编者 注 
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分 布 中 抽取 的 一 个 容量 为 12 的 样本 将 非常 接近 于 服从 正 态 分 布 . 当然 , 我 们 的 样 
本 容量 比 利 用 中 心 极限 定理 的 一 般 情 况 要 小 一 些 , 但 正 态 分 布 的 假设 看 起 来 是 合理 
的 . 


因为 z 服从 正 态 分 布 , 所 以 


因此 , 这 个 检验 统计 量 应 该 服从 一 个 自由 度 为 11 的 t 分 布 . 对 于 这 个 分 布 , 1.48 的 
t 值 对 应 于 一 个 0.083 的 p 值 . 虽然 这 不 是 肥料 能 增加 西红柿 大 小 的 具体 证 据 , 但 
我 可 能 会 一 直 使 用 它 , 直到 得 出 更 加 有 决定 性 的 数据 . 


22.4 ”假设 检验 的 问题 


给 出 假设 检验 的 基本 结构 并 对 它 有 了 直观 的 了 解 之 后 , 我 们 有 了 一 个 清醒 的 认 
识 : 假设 检验 不 是 完美 的 . 因为 我 们 最 终 要 从 概率 论 的 角度 来 论述 , 所 以 无 法 完全 
肯定 得 到 的 结论 . 我 们 可 能 会 犯 两 种 错误 : 错误 地 拒绝 一 个 正确 的 原 假设 , 或 者 无 
法 拒绝 一 个 不 正确 的 原 假设 . 统计 学 家 们 展现 了 他 们 在 命名 方面 的 天 赋 , 分 别 将 这 


些 错 误 定义 为 工 型 错误 和 II 型 错误 . 


本 节 要 点 
。 概率 论证 从 来 都 不 是 决定 性 的 . 
。 我 们 可 能 会 犯 两 种 错误 : 拒绝 一 个 正确 的 原 假 设 , 或 者 无 法 拒绝 一 个 不 正 
确 的 原 假设 . 
。T 型 错误 与 I 型 错误 之 间 有 一 个 折 中 . 


22.4.1 工 型 错误 

我 们 先 来 处 理工 型 错误 . 如 上 所 述 , 工 型 错误 是 拒绝 了 一 个 正确 的 原 假 设 . 为 
什么 会 发 生 这 种 情况 呢 ? 不 妨 假设 我 们 正在 检验 一 个 假设 , 并 且 已 经 确定 了 原 假 设 
是 正确 的 . a 水 平 (不 妨 设 为 0.05) 意味 着 , 如 果 我 们 个 然 观 察 到 了 一 个 发 生 概率 
少 于 5% 的 结果 , 那么 将 拒绝 原 假设 . 看 到 一 个 发 生 概 率 不 超过 5% 的 结果 的 机 会 
有 多 大 ? 恰好 是 5%! (这 很 容易 计算 .) 更 一 般 地 说 , 发 生 工 型 错误 的 概率 (在 原 假 
设 为 真 的 前 提 下 ) 恰好 是 a 水 平 . 
22.4.2 II 型 错误 

我 们 还 可 能 犯 另 一 种 错误 : 可 以 看 出 原 假设 是 错 的 , 但 无 法 拒绝 它 . 这 就 是 所 
胃 的 II 型 错误 . I 型 错误 比 工 型 错误 更 环 手 , 因为 它 与 你 识别 出 的 错误 原 假设 有 


二 村 
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关 . 为 什么 会 出 现 这 种 情况 ? 如 果 原 假设 是 错 的 , 那么 它 应 该 比较 容易 被 拒绝 . 但 
是 , 原 假 设 与 真实 情况 越 接近 , 就 越 难 被 拒绝 . 我 们 来 看 一 个 例子 . 

例子 : 想象 一 下 , 你 正在 试图 估算 所 在 大 学 里 成 年 男性 的 平均 身高 . 假设 真正 
的 总 体 均 值 是 6 英尺 (1.83 米 ), 标准 差 是 3 英寸 (7.62 厘米 ), 你 取 了 一 个 容量 为 
20 的 样本 . 如 果 原 假设 是 平均 身高 为 5 英尺 (1.52 米 ), 那么 在 0.05 的 a 水 平 下 ， 
出 现 I 型 错误 的 概率 是 多 少 ? 

解答 : 为 了 简单 起 见 , 不 妨 设 我 们 知道 标准 差 是 3 英寸 , 样本 均值 大 概 服从 正 
态 分 布 . 这 意味 着 , 如 果 样 本 的 平均 值 与 均值 之 差 超 过 了 1.96 个 标准 差 , 那么 我 们 
将 拒绝 可. 对 于 容量 为 20 的 样本 , 标准 差 是 s = of/Vn = 3/V50 = 0.67 英寸 . 因 
此 , 如 果 样 本 均值 大 于 5 英尺 1.31 英寸 , 或 者 小 于 4 英尺 10.69 英寸 , 那么 我 们 就 
拒绝 Ho. 也 就 是 说 , 如 果 样 本 均值 介 于 4 英尺 10.69 英寸 与 5 英尺 1.31 英寸 之 间 ， 
我 们 就 会 犯 I 型 错误 . 我 们 知道 , 对 于 容量 为 20 的 样本 , 它 真 正 服从 的 分 布 是 均 
值 为 6 英尺 且 标 准 差 为 0.67 英寸 的 正 态 分 布 . 由 此 可 知 , 出 现 I 型 错误 的 概率 约 
为 10-5 一 一 不 需要 担心 这 一 点 ! 

如 果 我 们 制定 了 更 合理 的 原 假 设 , 即 平均 身高 是 5 英尺 11 英寸 , 那么 会 出 现 
什么 情况 呢 ? 整个 分 析 过 程 与 之 前 相同 , 上 只 不 过 当 样 本 均值 落 在 5 英尺 9.69 英寸 与 
6 英尺 0.31 英寸 之 间 时 , 我 们 就 会 犯 II 型 错误 . 出 现 这 种 样本 的 概率 会 大 于 67%， 
所 以 我 们 很 有 可 能 犯 II 型 错误 . 这 里 的 原因 在 于 , 原 假设 与 事实 非常 接近 , 从 而 使 
我 们 经 常 看 到 与 原 假 设 一 致 的 数据 . 出现 II 型 错误 的 概率 (以 原 假 设 是 错误 的 为 
前 提 ) 被 称 为 8. 在 22.4.4 节 中 , 我 们 会 沿 着 这 种 思路 来 描述 检验 功效 . 


22.4.3 ”错误 率 与 司法 系统 


与 1 型 和 II 型 错误 相关 的 一 个 重要 概念 是 错误 率 . 工 型 错误 率 是 在 原 假设 为 
真 的 前 提 下 , 出 现 工 型 错误 的 概率 . 类 似 地 , II 型 错误 率 是 当 原 假设 为 假 时 , 出 现 II 
型 错误 的 概率 . 在 上 一 个 例子 中 , I 型 错误 率 为 0.67. 

考虑 了 型 和 工 型 错误 的 一 种 方式 是 在 刑事 审判 的 情况 下 . 陪审 员 会 给 出 被 告 
清白 的 原 假 设 , 然后 听取 证 词 . 如 果 能 说 明 被 告 清白 的 证 据 看 起 来 极 不 可 能 , 那么 
陪审 员 将 做 出 有 罪 的 定论 ; 如 果 证 据 不 够 充分 , 陪审 员 将 做 出 无 罪 的 定论 (注意 有 
罪 和 无 罪 的 说 法 : 按照 同样 的 方式 , 我 们 从 不 接受 原 假 设 , 只 拒绝 或 无 法 拒绝 原 假 
设 , 刑事 审判 永远 找 不 到 “清白 者 ”, 只 能 断定 有 罪 或 无 罪 ). 表 22-1 总 结 了 可 能 的 

我 们 看 到 , 在 这 个 审判 案例 中 , I 型 错误 意味 着 将 一 个 无 率 的 人 定罪 ,但 工 型 
错误 则 意味 着 让 罪犯 获得 自由 (因此 , I 型 错误 也 被 称 为 假 阳 性 , II 型 错误 被 称 为 假 
阴性 ). 这 两 种 结果 看 起 来 都 不 理想 有 没有 方法 可 以 降低 工 型 错误 和 I 型 错 
误 的 发 生 率 ? 乍 一 看 , 似乎 没有 办 法 . 如 果 陪 审 员 想 要 通过 得 到 更 有 说 服 力 的 证 据 
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来 减少 I 型 错误 , 那么 他 将 会 自动 地 使 任何 人 (包括 犯 了 罪 的 被 告 在 内 ) 更 加 难以 
定罪 . 因此 , 为 了 减少 I 型 错误 的 发 生 率 , 他 必然 会 增加 开 型 错误 的 可 能 性 . 但 是 ， 
我 们 可 以 做 一 件 事 来 减少 这 两 种 错误 一 一 只 需要 听取 更 多 的 证 据 . 我 们 对 事情 越 
清楚 , 就 越 不 容易 做 出 错误 的 判断 . 


表 22-1 ”刑事 审判 的 可 能 结果 . 原 假设 是 被 告 是 清白 的 ， 如 果 原 假设 是 他 犯 了 罪 , 那么 I 
型 和 II 型 错误 将 颠倒 过 来 


被 告 是 清白 的 被 告 犯 了 罪 
有 罪 I 型 错误 正确 
无 菲 正确 II 型 错误 


例子 : 当地 一 所 大 学 正在 对 学 生 进行 猪 流感 检验 , 这 种 流感 会 增加 入 体 白 细 
胞 (WBC) 的 数量 . 假设 健康 人 群 的 WBC 数 服 从 每 微 升平 均 7000 个 且 标 准 差 为 
1000 的 正 态 分 布 , 而 猪 流感 患者 的 WBC 数 则 服从 每 微 升平 均 11 000 个 且 标 准 差 
为 1500 的 正 态 分 布 . 由 于 这 种 疾病 具有 很 强 的 传染 性 , 所 以 学 院 想 要 隔离 那些 疑 
似 患 者 . 如 果 该 大 学 把 每 一 个 WBC 数 超过 9000 的 人 都 隔离 起 来 , 那么 相应 的 I 
型 错误 率 和 II 型 错误 率 分 别 是 多 少 ? 如 果 和 希望 II 型 错误 率 为 0.05, 应 该 设置 什 
样 的 临界 值 ? 

解答 : 我 们 先 来 看 一 下 该 大 学 把 每 一 个 WBC 数 超过 9000 的 人 都 隔离 起 来 的 
情况 . 在 这 种 情况 下 , I 型 错误 是 什么 ?I 型 错误 是 假 阳 性 , 所 以 它 会 认为 一 个 健康 
的 人 得 了 猪 流感 ， 这 种 情况 就 是 指 一 个 健康 人 的 WBC 数 超过 了 9000, 其 概率 为 
1 一 $B(2) = 0.023 ( 记 住 8 是 标准 正 态 分 布 的 累积 分 布 函数 ). 

那么 I 型 错误 呢 ? 当 我 们 把 一 个 患者 看 作 健 康 人 时 , 这 种 错误 就 发 生 了 . 只 要 
患者 的 WBC 数 小 于 9000, 这 种 错误 就 会 发 生 . 其 概率 为 8( 一 1.33) 0.091. 

如 果 和 希望 I 型 错误 率 为 0.05, 应 该 设置 什么 样 的 临界 值 ? 也 就 是 说 , 当 患 者 
的 WBC 数 低 于 临界 值 时 ，II 型 错误 就 会 出 现 ， 因 此 , 我 们 要 找到 使 得 &(z) 
0.05 的 z. 使 用 标准 正 态 分 布 表 , 我 们 发 现 这 个 z = -1.64. 因此 , 临界 值 应 该 
11 000 — 1.64 * 1500 = 8540. 

不 妨 再 思考 一 下 , 当 WBC 数 的 临界 值 为 8540 时 , I 型 错误 率 是 多 少 ? 这 正 是 
一 个 健康 人 的 WBC 数 超过 8540 的 概率 , 即 1 一 B(1.54) s 0.062. 我 们 再 次 看 到 了 
这 种 普遍 现象 , 即 降 低 I 型 错误 的 发 生 率 会 增加 I 型 错误 的 可 能 


22.4.4 功效 


当 原 假设 为 假 时 , 我 们 希望 检验 a 当 原 假设 确实 不 正确 
时 , 检验 的 功效 可 以 度量 我 们 能 够 成 功 拒绝 原 假设 的 可 能 性 . 因此 , 由 于 6 是 出 现 
II 型 错误 的 概率 ， 或 者 说 是 无 法 拒绝 一 个 错误 的 原 假设 的 概率 所 以 检验 的 功效 就 


入 
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是 我 


门 的 检验 可 以 成 功 拒 绝 一 个 错误 原 假 设 的 概率 , 即 1 一 6. 
显然 , 检验 的 功效 越 低 , 我 们 就 越 有 可 能 犯 I 型 错误 . 因此 , 当 无 法 拒绝 原 假 


设 时 , 首先 要 考虑 的 是 检验 的 功效 以 及 增加 功效 的 方法 . 通常 情况 下 , 出 现 问题 的 


原因 是 样本 容量 太 小 . 很 有 可 能 因为 样本 容量 太 小 , 不 足以 代表 我 们 想 要 概括 的 总 
体 , 最 终 导致 我 们 在 样本 之 外 检测 不 出 任何 显著 的 差异 . 在 一 个 容量 较 大 的 样本 中 ， 
我 们 会 得 到 更 多 数据 , 这 意味 着 如 果 原 假设 确实 是 假 的 , 那么 我 们 应 该 有 更 多 的 证 


据 来 证 明 原 假设 不 成 立 . 换 句 话说 , 如 果 总 体 具有 显著 差异 , 那么 增加 样本 容量 , 从 


而 使 样本 更 接近 真 


实 的 总 体 , 将 会 增加 发 现 差异 的 可 能 性 . 


例如 , 假设 我 们 想 知道 一 架 飞 机 上 的 30 名 乘客 是 比较 喜欢 午餐 菜单 中 新 增 的 
鱼 , 还 是 喜欢 经 典 的 牛排 (假定 没有 人 是 素食 主义 者 ). 这 里 的 原 假设 是 乘客 对 两 种 


食材 的 喜好 没有 区 


显 偏 好 的 乘客 中 选 


别 . 假设 有 25 名 乘客 确实 相对 比较 喜欢 吃 鱼 , 但 其 余 5 人 没有 


明显 的 偏好 . 如 果 我 们 有 一 个 容量 为 4 的 小 样本 , 并 且 他 们 恰好 是 从 这 5 位 没有 明 


出 来 的 , 那么 就 不 能 拒绝 原 假设 , 但 对 于 包含 30 位 乘客 的 总 体 


来 说 , 这 显然 是 错误 的 . 当选 出 10 名 乘客 时 , 我 们 就 会 发 现 这 种 差异 , 因为 只 有 5 


位 乘客 是 无 所 谓 的 . 因此 , 提高 功效 的 一 种 方法 是 增加 样本 容量 . 在 本 章 的 最 后 , 我 
们 将 介绍 几 种 增加 功效 的 方法 . 


22.4.5 ”效应 量 


正如 上 一 节 所 说 的 , 检验 功效 用 来 度量 真实 值 与 假设 值 之 间 有 多 远 . null 值 p 


0 
与 真实 值 p 之 间 的 距离 就 是 效应 量 . 但 是 , 因为 我 们 不 知道 真实 值 , 所 以 效应 量 就 


被 视 为 po 与 观测 值 之 差 . 


效应 量 对 于 我 


们 理解 假设 检验 的 功效 至 关 重 要 . 大 的 效应 意味 着 较 小 的 I 型 


错误 , 从 而 检验 就 有 更 大 的 功效 . 男 一 方面 


小 的 效应 意味 着 较 大 的 开 型 错误 , 从 


而 会 有 较 小 的 功效 


. 因此 , 知道 效应 量 与 样本 容量 可 以 帮助 我 们 确定 检验 功效 . 但 


这 里 的 问题 是 , 在 设计 检验 时 , 我 们 还 不 知道 观测 值 是 多 少 , 从 而 无 法 计算 效应 量 . 


这 意味 着 我 们 必须 


尝试 几 种 不 同 的 效应 量 , 并 研究 它们 能 带 来 的 后 果 , 当 研 究 人 员 


设计 一 项 课题 时 , 他 们 通常 知道 能 对 结论 产生 影响 的 效应 量 是 多 少 , 并 以 此 来 估计 


所 需 的 样本 容量 n. 
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到 目前 为 止 , 我 们 只 对 均值 做 了 假设 检验 , 但 是 也 可 以 对 其 他 有 趣 的 参数 进行 
检验 . 本 节 将 讨论 如 何 对 方差 进行 假设 测试 , 以 及 如 何 检验 模型 自身 . 但 在 此 之 前 ， 
我 们 需要 引入 一 个 非常 重要 的 分 布 , 即 所 谓 的 x? 分 布 . 接 下 来 , 我 们 进行 快速 回顾 ， 
更 多 相关 介绍 , 请 参阅 第 16 章 . 
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本 节 要 点 
。 服从 正 态 分 布 的 随机 变量 与 服从 卡 方 分 布 的 随机 变量 之 间 有 一 定 的 关联 . 
。 这 种 关联 引出 了 样本 方差 与 t 检验 . 
。 我们 可 以 利用 服从 卡 方 分 布 的 随机 变量 来 检验 理论 和 实验 的 拟 合 优 度 . 


22.5.1 ” 卡 方 分 布 与 方差 检验 
设 X 服从 标准 正 态 分 布 , 那么 X? 服从 什么 分 布 ? 我 们 可 以 很 容易 地 找到 X? 
的 概率 密度 函数 : 
Prob(a < X? <b) =Prob(Va < X < vb)+Prob(~-Vb < X < —Va) 


VD 
=2.Prob(Va < X < vb) = 3/ e-® /2dz. 
Va V2n 
现在 把 w= zx? 代入 上 式 . 那么 积分 限 就 变 成 了 从 a 到 并 且 dz = 3, 于 是 有 
Prob(a < X* < 5) = 2 1 eu/2 一 du 1 -1/2 e—u/2da 
Bs Bs VV 于 37 ; 


所 以 , X? 的 概率 密度 函数 是 1/V 玩 z-1/2e-z/2， a 
函数 之 一 , 它 的 分 布 称 为 自由 度 为 1 的 卡 方 分 布 . 与 + 分 布 相似 , x? 分 布 是 一 族 分 
布 , 其 参数 是 自由 度 . 更 一 般 地 , x? 分 布 有 如 下 定义 . 


自由 度 为 的 x? 分 布 : 设 X; 是 相互 独立 且 均 服从 标准 正 态 分 布 的 随机 变量 
(其 中 1<i<), 那么 随机 变量 


Y = 2+ 十:… 十 XX 
服从 自由 度 为 的 x? 分 布 , 并 常 记 作 x&. 


注意 , 由 这 个 定义 可 以 马上 推出 , 如 果 了 ~ 站 且 闫 ~ 驹 , 那么 只 要 对 和 Y 
是 相互 独立 的 , 就 有 XX 十 Y ~ X21. 

对 于 自由 度 为 的 x? 分 布 , 其 概率 密度 函数 为 

f(x) = 二 人 2 e -7/2， 

其 中 工 是 伽 马 函 数 . 在 图 22-5 中 , 我 们 给 出 了 卡 方 分 布 的 图 形 . 
那么 , 我 们 究竟 为 什么 要 讨论 这 个 看 起 来 挺 好 笑 的 分 布 呢 ? 一 个 原因 是 , 对 于 
服从 正 态 分 布 的 随机 变量 , 其 样本 方差 与 x? 分 布 密切 相关 . 考虑 一 个 服从 N (no?) 
的 随机 变量 X, 假设 我 们 从 这 个 随机 变量 中 取出 了 一 个 容量 为 n 的 样本 . 我 们 之 
前 已 经 看 到 过 , 样本 均值 z 应 该 服从 N(1,o?/n), 于 是 
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! 3 一 eR pm 
图 22-5 ” 卡 方 分 布 的 图 形 , 其 中 we {1,2,3,5,10,20}. 随 着 自由 度 的 增加 , 凸 起 位 置 不 断 向 
右 移动 


现在 假设 需要 计算 样本 方差 : 
1 Nn 
5” = 2 
一 个 自然 的 问题 是 : 样本 方差 服从 什么 分 布 ? 因为 样本 方差 不 取 负 值 , 所 以 它 不 可 
能 服从 正 态 分 布 . 但 是 , 在 计算 样本 方差 时 , 我 们 需要 对 一 大 堆 (z; 一 x) 项 求 平方 ， 
所 以 样本 方差 可 能 会 服从 x? 分 布 . 为 了 弄 清 楚 样本 方差 服从 什么 分 布 , 我 们 先 考 
虑 一 些 非常 接近 于 真实 方差 的 量 : 


1 n 
元 >》， (zi 一 1 
$= 
这 与 方差 的 常规 表达 式 极 为 相似 , 但 是 缺少 了 一 个 因子 1/n, 而 且 多 了 一 个 1/c2. 


稍 后 我 们 将 阐述 做 出 这 些 变动 的 原因 . 通过 巧妙 地 添加 0 上 式 可 以 改写 成 
1 忆 ] 
(+ 

i=1 i=1 
1 nN 

= (C013) + /+ 2 3)(z—))) 
d=1 


此 时 # 一 4 是 一 个 常数 ,所 以 3% 1(z 一 J)?==n(z 一 1)>. 由 Dwi(zwi 一 3X) 二 0 可 知 ， 
Di(zi 一 7)(z— hn) = 0. 于 是 ， 这 个 等 式 就 简化 成 了 
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再 做 一 次 巧妙 的 代数 运算 , 就 大 功 告 成 了 : 


/ri;— De _2 五 一 ? 

> (2 = 三 > (zi — 1)2 1 (3 | (22.4) 
现在 来 看 一 下 这 个 结果 . 我 们 知道 (zi; - jy)/o 服从 标准 正 态 分 布 , 所 以 由 前 面 的 定 
义 可 知 , 等 式 的 左 端 将 服从 自由 度 为 n 的 x? 分 布 . 另外 , 已 知 (z 一 Jj)/Vo3/n 服从 
标准 正 态 分 布 , 所 以 等 式 右 端 的 第 二 项 会 服从 自由 度 为 1 的 x2 分 布 . 现在 剩 下 的 唯 
一 项 是 等 式 右 端 的 第 一 项 , 而 它 与 样本 方差 的 公式 非常 相似 . 它 就 是 (n 一 1)s?/o?. 
那么 它 服从 什么 分 布 呢 ? 我 们 知道 , x? 分布 有 一 个 不 错 的 加 法 性 质 : 如 果 Xi ~ x 
日 Xo ~ xX, 那么 只 要 1 与 X 相互 独立 , 就 有 Xi 十 X2 ~ X24. 因此 , 如 果 (22.4) 
式 右 端的 第 一 项 和 第 二 项 是 相互 独立 的 , 那么 有 


(nC—1)s? 


~ 


2 (22.5) 
虽然 它们 是 相互 独立 的 , 但 对 这 一 点 的 证 明 远 远 超 过 了 入 门 课 的 范围 ). 

所 以 , 现在 我 们 看 到 了 为 什么 要 花 那 么 多 时 间 来 研究 x? 分 布 一 一 只 要 我 们 
从 正 态 分 布 中 取样 , 样本 方差 (更 确切 地 说 , 样本 方差 的 倍数 ) 就 会 服从 x? 分 布 ! 
此 外 , 一 旦 知道 了 某 个 参数 的 分 布 , 我 们 就 可 以 检验 关于 这 个 参数 的 假设 . 下 面 来 
看 几 个 关于 方差 的 假设 检验 的 例子 . 这 个 例子 用 到 了 强大 的 代 回 法 . 

例子 : 可 口 可 乐 工 三 正在 安装 一 种 新 机 器 , 它 可 以 把 沿 着 闭 瓶 器 移动 的 可 乐 倒 
入 瓶 中 . 为 了 确保 瓶装 产品 几乎 具有 统一 的 规格 , 他 们 希望 这 人 台 机 器 平均 每 次 分 配 
12 发 司 的 可 乐 , 并 且 标 准 差 不 超过 0.05 玲 司 . 在 20 瓶 样品 中 , 每 瓶 的 液体 量 如 下 
所 示 : 


og 


11.83 12.09 11.93 12.02 11.98 
11.97 12.06 12.08 12.06 12.02 
12.01 12.10 12.04 11.98 12.04 
12.00 12.04 12.09 12.00 11.92. 
这 些 数据 是 否 符合 公司 的 要 求 ? 
解答 : 现在 有 zx = 12.01, 这 样 看 来 机 器 的 分 配 是 合适 的 . 如 果 愿 意 的 话 , 我 们 
可 以 对 这 个 均值 进行 检验 , 但 现在 要 考察 方差 . 样本 方差 是 s? = 0.0045, 也 就 是 说 ， 
样本 标准 差 是 0.067, 比 预 期 的 标准 差 要 高 . 这 是 一 个 显著 的 增长 , 还 是 一 种 偶然 情 
况 ? 我 们 把 原 假设 设 为 o = 0.05, 即 o? = 0.0025. 从 式 (22.5) 的 检验 统计 量 中 可 以 
看 出 , 应 该 有 


(nC— 1)s? 
02 人 X19: 


20 个 观测 值 并 不 多 , 不 足以 使 用 中 心 极限 定理 , 所 以 要 使 用 t 检验 , 不 过 我 们 假设 
每 个 单独 的 测量 都 服从 正 态 分 布 (其 方差 是 未 知 的 , 但 我 们 假设 均值 是 已 知 的 ). 
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我 们 得 到 了 一 个 34.2 的 x? 统计 量 . 这 里 应 该 使 用 单 侧 检验 还 是 双 侧 检验 ? 显 
然 , 我 们 不 需要 担心 方差 太 小 , 所 以 单 侧 检验 似乎 是 合理 的 . 对 于 自由 度 为 19 的 卡 
方 分 布 , 34.2 的 检验 统计 量 进行 单 侧 检验 的 p 值 为 0.0174. 这 是 一 个 很 小 的 p 值 ， 
所 以 我 们 担心 机 器 的 方差 太 大 . 但 是 , 依据 更 换 机 器 的 成 本 , 我 们 可 能 需要 收集 更 
多 的 数据 , 以 确保 没有 给 出 一 个 不 寻常 的 样本 . 
现在 不 妨 来 检验 一 下 均值 (做 一 个 简单 的 回顾 ). 我 们 想 看 看 机 器 的 平均 分 配 
量 是 否 接近 12 淮 司 . 令 原 假设 为 y = 12, 我 们 有 
元 一 以 


二 
VS2/n 
这 给 出 了 下 面 的 检验 统计 量 
12.01 一 
A 
V0.0045/20 


它 应 该 服从 一 个 自由 度 为 19 的 t 分 布 . 与 这 个 t 值 相应 的 p 值 约 为 0.5, 这 个 值 显 
然 不 够 大 , 所 以 无 法 拒绝 /= 12 的 原 假设 . 因此 , 虽然 我 们 还 没有 证 明 这 台 机 器 的 
平均 分 配 量 约 为 12 融 司 , 但 收集 的 数据 肯定 与 这 种 可 能 性 并 不 矛盾 . 
22.5.2 ” 卡 方 分 布 与 t 分 布 
我 们 发 现 x? 分 布 与 我 们 熟知 且 喜 爱 的 另 一 个 分 布 有 关 : t 分 布 . 实际 上 ,上 分 
布 可 以 用 x? 分 布 来 定义 , 具体 定义 如 下 所 示 . 
自由 度 为 kk 的 t 分 布 : 设 2 服从 标准 正 态 分 布 , 且 到 服从 自由 度 为 n 的 x? 
分 布 , 那么 , 自由 度 为 n 的 t 分 布 是 
了 
~t 


VY 


这 个 定义 看 起 来 可 能 有 些 奇怪 , 但 我 们 马上 会 看 到 它 是 非常 自然 的 . 它 直 接 来 

源 于 我 们 在 前 几 节 中 的 发 现 : 在 进行 z 检验 时 , 用 样本 方差 来 代替 真实 方差 . 假设 

有 一 个 随机 变量 X, 它 服 从 均值 为 1 且 方 差 为 o? 的 正 态 分 布 , 然后 从 这 个 变量 中 
取出 一 个 容量 为 n 的 随机 样本 . 于 是 , 我 们 有 

元 一 人 


~ N(0,1). 
如 前 所 述 , 样本 方差 sz 满足 
_ 12 
@ Xe 


现在 把 o? 蔡 换 成 s2, 并 巧妙 地 乘 以 1: 
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1 


Ep Th er a . 
Vs2/n (nC—1)o?.s? Vo /n (n— 1)s? 
(n—1)o2.n (nC— 1)o? 
通过 观察 这 个 等 式 , 我 们 发 现 (z 一 pj)/Vo2/n 服从 标准 正 态 分 布 , 而 (n 一 1)s?/o? 


服从 自由 度 为 n 一 1 的 x 分布 .把 (5 一 /Vo2/n 蔡 换 成 2, 并 把 (mn 一 1)s2/o? 总 
换 成 二,_1, 这 样 就 得 到 了 


了 

Wi 

n—1 
这 正 是 上 面 给 出 的 自由 度 为 n 一 1 的 t 分 布 的 定义 . 
22.5.3 ”列表 数据 的 拟 合 优 度 

假设 检验 最 重要 的 用 途 之 一 是 检验 模型 ， 因 为 我 们 一 直 在 谈论 证 明 你 所 选择 

分 布 的 合理 性 有 多 重要 , 所 以 这 是 一 个 非常 有 用 的 工具 . 假设 我 们 正在 收集 数据 ， 
并 且 有 大 个 可 能 的 结果 (例如 , 在 你 的 概率 论 班 里 , 考虑 每 个 人 的 出 生 月 份 . 这 有 
12 种 可 能 的 结果 ). 接 下 来 , 可 以 构造 一 个 观测 数据 列表 {O01,O2,… , Ox}, 其 中 O; 
表示 我 们 观测 到 的 第 i 个 结果 出 现 的 次 数 . 我 们 也 可 以 对 这 些 数据 建 模 , 即 出 现 第 
i 个 结果 的 概率 是 p; (例如 , 我 认为 教室 里 有 10% 的 人 出 生 在 1 月 , 有 7% 的 人 出 
生 在 2 月 , 等 等 ). 然后 , 可 以 利用 下 面 的 检验 统计 量 来 检验 这 个 假设 : 


2 Ek Oi; — Ei)? 
Se ) 


(22.6) 


) 
j= 


其 中 E; 是 指 在 原 假设 下 , 我 们 预计 观察 到 事件 i 的 次 数 . 你 会 注意 到 , 我 们 暗示 性 
地 把 检验 统计 量 命 名 为 x?. 事实 证 明 , 这 个 检验 统计 量 确实 服从 自由 度 为 k 一 1 的 
X2 分 布 . 请 注意 , 自由 度 取决 于 我 们 拥有 的 类 别 数量 , 而 不 是 数据 点 的 数量 . 
关于 这 个 检验 统计 量 为 什么 会 服从 x2 分 布 , 甚 一般 证 明 相 当 有 难度 . 但 是 , 为 
了 对 结果 有 一 个 直观 的 认识 , 我 们 来 证 明 二 项 情形 下 的 结论 (也 就 是 说 , 只 有 两 种 
可 能 的 结果 ). 假设 我 们 已 经 收集 了 nn 个 数据 点 , 并 且 观 察 到 第 一 种 结果 出 现 了 0O1 
次 , 第 二 种 结果 出 现 了 O02 次 . 另外 , 假设 有 一 个 模型 指出 第 一 种 结果 出 现 的 概率 
为 pi, 第 二 种 结果 出 现 的 概率 是 zz. 注意, 我 们 期 望 第 一 种 结果 出 现 了 npi 次 , 第 
二 种 结果 出 现 了 mps 次 . 这 表明 我 们 的 检验 统计 量 为 
x - (O1 — np1)” | (O2 — np) 
ND Np2 


已 知 pi 十 pz = 1 所 以 po = 1 一 pi. 据 此 , 可 以 对 上 式 做 一 些 简 化 . 另外 , O01 十 02 = n， 
那么 O02 = n 一 O01. 于 是 , 我 们 得 到 了 
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2 (Oi1—np1)?  ((n— O01)—n(l—p1))? 


te Np1 n(l— pi) 
(1 — pi)(O1— np1)? +pi(—O01+ np1) 
npi(l — pi1) 


2 (O1 — np1)? a ( O1 — npi1 ) 
npi(1 — p1) np 一 DJ 

因为 O1 服从 规模 为 n 且 概 率 为 pi 的 二 项 分 布 , 所 以 由 中 心 极限 定理 可 知 , 对 
于 较 大 的 mw O1 守 N (npi,npi(1 一 p1)). 因此 , x? 是 一 个 服从 标准 正 态 分 布 的 随机 变 
量 的 平方 . 这 意味 着 , 它 的 确 服 从 自由 度 为 1 的 x? 分布 ( 当 n 足 够 大 时 ,利用 中 心 极 
限定 理 ). 这 个 证 明 还 让 我 们 看 到 了 为 什么 自由 度 始终 比 类 别 数 少 一 : 如 果 有 天 个 可 
能 的 结果 , 并 假设 它们 发 生 的 概率 是 {pi1,p2,… ,pk 那么 利用 pi 十 pz 十 … 十 pn = 二 1 
和 O1 十 O02 十 … 十 Ok = 二 nn 的 限制 条 件 , 我 们 可 以 从 方程 中 删除 一 个 类 别 , 然后 通 
过 重新 排列 其 余 项 来 得 到 一 1 个 服从 标准 正 态 分 布 的 随机 变量 的 平方 和 ( 即 自 
度 为 一 1 的 x? 分 布 ). 

例子 : 假设 你 正在 调查 职业 棒球 大 联盟 中 球员 出 生 月 份 的 分 布 情况 (参见 表 
22-2). 乍 一 看 , 你 可 能 会 认为 出 生 月 份 与 运动 能 力 无 关 , 也 会 认为 原 假设 是 棒球 运 
动员 的 出 生 月 份 是 均匀 分 布 的 . 下 面 是 1950 年 之 后 出 生 的 美国 大 联盟 球员 的 数据 ， 
这 些 球员 都 是 在 2005 年 之 前 加 入 的 . 


表 22-2 
出 生 月 份 球员 人 数 
387 
329 
366 
344 
336 
313 
313 
503 
421 
434 
398 
371 


天 
于 司 CO CPCARRNODPDr- 


jm 
MP 


有 了 这 些 数据 后 , 对 于 球员 的 出 生 月 份 应 该 是 均匀 分 布 的 假设 , 你 能 得 出 什么 
样 的 结论 ? 
解答 : 从 数据 来 看 , 我 们 注意 到 8 月 到 10 月 有 相当 大 的 偏差 . 难道 这 只 是 偶 
然 , 还 是 发 生 了 什么 事 ? 和 往常 一 样 , 我 们 通过 假设 检验 来 看 看 发 生 了 什么 .既然 
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我 们 假设 出 生 月 份 对 运动 能 力 没 有 影响 , 那么 预计 在 4515 名 球员 中 , 每 个 月 出 生 
的 人 都 恰好 占 了 1/12, 或 者 说 恰好 有 376.25 个 人 . 我 们 感 兴趣 的 检验 统计 量 是 刚 
刚 给 出 的 拟 合 优 度 统计 量 , 即 


5 过 


Wg 


二 (k 月 出 生 的 人 数 一 376.25)? 


A 作 


k=1 


由 于 每 个 球员 都 可 能 出 生 在 


376.25 


93.07. 


12 个 月 中 的 任何 一 月 , 我 们 的 检验 统计 量 应 该 服从 一 
个 自由 度 为 11 的 x2 分 布 . 但 是 , 在 计算 > 值 之 前 , 需要 确定 使 月 


侧 检 验 . 这 个 检验 统计 量 是 不 是 真 的 “ 太 小 了 ”? 如 果 数 据 与 


昌 单 侧 检 验 还 是 双 
模型 完全 拟 合 , 那么 每 


一 项 都 是 0, 并 且 这 个 检验 统计 量 也 是 0. 这 会 让 我 们 想 要 拒绝 原 假设 吗 ? 一 点 儿 


也 不 会 ! 我 们 很 高 兴 能 有 这 么 好 的 数据 ， 因 此 , 只 有 当 检 验 统计 量 很 大 时 , 我 们 才 
会 担心 . 这 意味 着 我 们 将 使 用 单 侧 检 验 . 在 自由 度 为 11 的 1 


参阅 第 1 章 . 
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假设 检验 最 有 用 的 应 用 


FF 方 分 布 的 
93.07 的 检验 统计 量 所 对 应 的 p 值 是 4.1 x 10 15. 关于 运动 员 生 日 的 更 多 信息 , 请 


E 侧 检验 中 ， 


之 一 是 比较 两 个 (或 更 多 个 ) 不 同样 本 的 均值 . 对 于 任 
何 类 型 的 比较 性 决策 , 这 些 检验 都 很 重要 : 使 用 药物 4 来 生发 的 患者 会 比 使 用 药 


物 B 的 多 吗 ? 人 们 喜欢 可 口 可 乐 还 是 百事 可 乐 ? 就 像 在 单 样本 检验 中 局 


和 


检验 


的 精确 性 取决 于 我 们 对 方差 的 了 解 程 度 . 这 有 三 种 可 能 性 (难度 依次 递增 ): 方差 已 


知 ; 方差 未 知 , 但 有 理由 相信 它们 是 一 样 的 ; 方差 未 知 , 并 


下 来 , 我 们 要 对 这 些 问题 进行 处 理 . 


它们 可 能 互 不 相同 . 接 


本 节 要 点 


。 对 两 个 总 体 进行 检验 , 它们 的 方差 已 知 但 互 不 相同 . 


。 对 两 个 总 体 进 行 检验 , 它们 的 方差 未 知 


方差 , 它 是 对 未 知 方差 的 加 权 估 计 . 


。 对 于 方差 未 知 且 互 不 相同 的 两 个 总 体 , 我 们 可 以 利 


用 近似 来 处 理 . 


旦 是 相等 的 ， 这 涉及 合并 (样本 ) 


22.6.1 ” 双 样 本 z 检验 : 方差 已 知 
设 随机 变量 X 和 了 的 方差 是 已 知 的 , 且 分 别 为 cz 和 o2. 设 乏 是 从 X 中 取 


出 的 一 个 容量 为 nz 的 随机 检 


fF 本 的 均值 ,Y 是 从 Y 中 取出 的 一 个 容量 为 wy 的 随机 


样本 的 均值 . 通过 构造 随机 变量 XX 一 了 , 我 们 可 以 比较 X 与 Y 的 均值 . 如 果 X 和 


Y 是 相互 独立 的 , 那么 
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人 这 二 区 二 人 让 加 


类 似 地 , 疲 一 立 的 期 望 值 等 于 


一 击 二 天 而 二 直到: 需 二 遍 
如 果 关 与 Y 都 服从 正 态 分 布 , 那么 由 “ 正 态 分 布 之 和 仍然 是 正 态 分 布 ”( 注 意 我 们 
如 何 又 一 次 使 用 了 “ 正 态 分 布 是 一 个 稳定 分 布 ” 的 事实 ) 可 知 
X—-Y ~ N(z 一 Ny;02 /nz 十 oy/ny) 
革 一 了 可 以 标准 化 成 下 列 形式 : 
(3— -Kz— Hy) 


3 ~ N(0,1). (22.7) 
Ox 十 Oy 
Ny Ny 


现在 假设 我 们 想 对 ys - py 的 值 做 假设 检验 ， 为 了 简单 起 见 , 不 妨 设 我 们 想 看 看 
Lz > jy 是 否 成 立 . 我 们 给 出 pv -pw < 0 的 原 假设 , 并 令 jw = pwy. 然后 对 X 和 
Y 进行 取样 , 并 计算 二 和 多 利用 式 (22.7) 以 及 在 原 假设 下 js - / = 0 这 一 事实 ， 
我 们 看 到 检验 统计 量 就 是 


将 


Nz Ny 
并 且 z 应 该 服从 标准 正 态 分 布 . 与 往常 一 样 , 我 们 使 用 这 个 z 值 来 计算 > 值 , 并 根 
据 显著 性 水 平 来 决定 是 否 拒绝 原 假 设 . 

方差 已 知 的 双 样 本 z 检验 : 如 果 X 和 了 是 相互 独立 的 随机 变量 , 它们 的 方差 
分 别 是 已 知 的 cz 和 o2, 那么 


(2—D- (Kr -Hy) N(0,1). 


贞 


2 
0 0 
PA 十 pA 
nz ny 


假设 : 仅 当 过 和 了 都 服从 正 态 分 布 时 , 上 述 绪论 才 成 立 . 


为 了 对 双 样 本 检验 的 使 用 有 一 定 的 了 解 , 我 们 来 看 一 个 例子 . 

例子 : 你 在 为 一 名 睡眠 研究 者 工作 , 他 想 看 看 睡眠 对 考试 成 绩 的 影响 . 为 此 , 该 
研究 者 召集 了 28 个 人 , 并 随机 指定 其 中 一 半 的 人 在 第 二 天 早上 来 之 前 睡 足 8 个 小 
时 ,而 另 一 半 的 人 则 只 睡 4 个 小 时 . 第 二 天 早上 , 他 对 这 两 组 人 进行 测试 并 记录 了 
他 们 的 成 绩 . 假设 研究 人 员 得 到 了 如 表 22-3 所 示 的 数据 . 
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表 22-3 
X = 睡眠 充足 的 组 Y = 睡眠 不 足 的 组 
73 76 
95 65 
93 74 
89 59 
79 75 
90 76 
86 71 
91 76 
98 74 
74 84 
91 71 
90 77 
50 96 
70 81 
MH1 = 83.5 12 = 75.4 
5? = 168.6 =73.32 


根据 这 些 数据 , 你 能 否 得 出 , 在 5% 的 显著 性 水 平 下 , 睡眠 有 助 于 提高 测试 中 
的 表现 ? 
解答 : 在 收集 了 这 些 数 据 并 计算 出 两 组 人 的 样本 均值 和 方差 后 , 我 们 提出 以 下 


假设 : 


Ho: HH 一 AH < 0 
Hoa: ti—k > 0. 


也 就 是 说 , 我 们 假定 睡眠 没有 好 处 , 并 希望 通过 拒绝 原 假设 来 文 持 睡 眠 确实 是 有 益 
的 备 择 假设 . 请 注意 , 我 们 正在 做 单 侧 检验 . 这 样 做 看 起 来 是 合理 的 , 因为 有 大 量 
证 据 表 明 , 睡眠 并 没有 坏处 (除了 那些 睡 过 头 错过 考试 的 学 生 ). 在 这 种 情况 下 , 检 
验 统计 量 应 该 是 什么 ? 如 果 假 定 原 假设 成 立 , 那么 可 以 令 jw 一 wa = 0. 由 于 我 们 想 
检验 的 是 这 两 个 均值 是 否 互 不 相等 , 所 以 考察 随机 变量 X 一 》 是 很 自然 的 . 如 果 
假设 关 和 YY 都 服从 正 态 分 布 , 那么 由 上 述 讨论 可 知 


NO 


2 ， 邓 
下 十 中 
ny 


(你 可 能 想 知 道 为 什么 这 里 没有 pw 一 1 项 : 记 住 , 我 们 假定 了 原 假设 是 成 立 的 , 这 意 
味 着 jw 一 jy = 0.) 你 可 能 已 经 发 现 了 一 个 问题 : 公式 要 求 我 们 使 用 cz 和 o2, 但 现 
在 只 有 s2 和 s2! 我 们 最 终 会 借助 t 分 布 来 解决 这 个 问题 (就 像 在 单 样本 检验 中 所 
做 的 那样 ), 但 现在 不 妨 设 我 们 已 经 得 到 了 正确 的 方差 , 并 令 o2 = 168.6, a2 = 73.32. 


Da 
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因此 , 检验 统计 


这 个 z 值 ( 记 住 , 我们 做 日 


三 本 
量 为 


党 可 靠 的 证 据 ， 


83.5 一 75.4 
168.6 二 
14 


14 


73.32 


说 明了 睡 


Ty 


RD 


22.6.2” 双 样本 t 检验 : 方差 未 知 但 相等 


正如 我 们 在 


; 浴 


们 知道 


方差 . 通常 情况 下 , 我 


用 样本 方差 来 代替 实际 方差 , 但 这 样 
有 两 种 情况 需要 考虑 : 相 


点 刻意 , 但 我 们 
解 , 而 且 


假设 我 们 知 


况 下 , 就 像 第 一 


先 考 虑 这 种 情 


; 深 


道 
次 


现在 有 两 个 变量 
一 种 可 能 的 做 法 
的 无 偏 估计 量 . 


呢 ? 


o2 


入 只 使 用 s2 就 
和 s2 从 而 得 至 


二 所 以 要 计 


已 
是 完全 


相当 
更 好 的 估计 


E 上 一 个 例子 中 所 看 到 
门 事 先 3 


EF 本 方差 相 
4 形 ， 
数学 运算 也 更 简单 一 些 . 


入 检验 那 术 


3(s2 十 s?) (之 所 以 称 为 s 是 因 


改 的 代 


的 是 单 侧 检验 ! ) 所 对 应 的 p 值 约 为 0.0256. 这 是 一 个 非 
上 实 对 考试 表现 有 好 处 . 


的 , 使 用 z 检验 进行 双 样 本 假设 检验 要 求 我 
不 知道 方差 , 而 是 从 样本 中 估算 . 然后 , 可 以 
介 是 所 有 估计 都 更 加 不 确 
日 等 和 样本 方差 不 等 . “方差 相等 ”看 起 来 可 能 有 


定 . 实际 上 ， 


站 全 已 


为 为 它 能 


为 


证 我 们 对 一 般 情形 有 


X 和 YY 有 相同 的 方差 c2, 但 不 知道 具体 等 于 多 少 . 在 这 种 情 
来 估算 方差 . 之 前 , 我 们 构造 了 样本 方差 s2, 但 
| 算 s2 和 呈 . 该 如 何 把 它们 结合 起 来 从 而 得 到 一 个 估计 


个 整体 的 直观 了 


忽略 s2, 只 使 用 s2. 这 是 可 行 的 , 因 
日 我 们 还 可 以 做 得 更 好 . 既然 已 经 对 X 和 Y 进行 了 取样 , 屠 
于 将 数据 丢弃 (这 绝 不 是 一 个 好 主意 )， 那 么 应 该 怎样 


;党 


起 


为 我 们 知 


2 旦 
52 十 


士 人 
结合 s2 


| 呢 ? 我 们 可 以 对 两 者 进行 同等 的 加 权 , 并 把 估计 值 设 为 


为 我 们 合 3 


差 ). 但 这 也 不 是 理想 的 情况 : 假设 有 1000 个 来 自 


样本 . 我 们 是 否 


人 


好 的 估计 


真 


人生 


|. 实际 上 , 我 人 


了 方差 


这 就 是 所 谓 的 合并 方 


X 的 样本 , 以 及 10 个 来 自 Y 的 


的 想 在 估计 值 中 为 52 分 配 一 半 的 权重 ? 可 能 不 是 
可 以 做 出 的 最 好 信 计 


因为 X 应 该 
是 给 出 一 个 加 权 平 均 结 果 


双 样 本 的 合并 方差 : 设 随 机 变量 X 和 YY 是 相互 独立 的 ， 
的 最 优 佑 计 是 合并 方差 s2, 即 


(nz 一 Is 十 (wy 一 1 55 


差 o2, 那么 方差 


噩 仆 . 
并 且 它们 有 具有 相同 的 方 


Nz Ry 2 


合并 方差 的 表达 式 并 不 太 复 你, 但 
注意 , 这 是 


步 整 理 . 设 7 = 


mr 一 1 


mz 十 yy 一 2 


站 


度 之 和 . 于 是 , 上 站 


的 表达 式 就 变 成 了 
sp SS 7 82 十 (1 一 7 


确实 有 点 混乱 . 幸好 , 我 们 可 以 对 它 做 进 一 


2 
。 Sy 


有 的 分 子 是 s2 的 自由 度 , 而 分 母 是 4 与 5 的 
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这 确实 是 ss 和 s? 的 加 权 平 均值 (因为 0<7<1 且 7+(1 一 7)=1), 其 中 样本 方 
差 的 权 数 由 它们 的 自由 度 来 确定 . 

既然 得 到 了 方差 的 估计 值 , 接 下 来 就 按照 与 单 样本 情形 相同 的 步骤 继续 进行 下 
去 . 把 o? 蔡 换 成 &2, 此 时 检验 统计 量 就 和 t 分 布 . 


双 样本 t 检验 一 方差 未 知 但 相等 设 随机 变量 X 和 Y 是 相互 独立 的 , 并 且 
它们 具有 相同 的 方差 o? 及 合并 方差 s2, 那么 


(ZC—Y)— (Kz — Hy) 


tns+ny—2: 


sp ,5p 
十 
Nz ny 


假设 : 我 们 需要 知道 和 站 都 服从 正 态 分 布 . 


注意 , 我 们 的 检验 统计 量 服从 自由 度 为 wz 十 ny 一 2 的 上 分 布 , 而 ns 十 ny 一 2 
恰好 是 s 与 3 的 自由 度 之 和 . 
重点 : 和 往常 一 样 , 为 了 使 用 t 检 验 , 我 们 需要 一 个 基本 的 正 态 分 布 . 就 目前 的 
情况 而 言 , 我 们 需要 知道 
(2—D— (Kz Hy) N (0,1). 


02 02 
一 十 


nz ny 
值得 庆幸 的 是 , 对 大 多 数 合 理 的 样本 容量 和 分 布 来 说 , 即使 X 和 了 都 不 服从 正 态 
分 布 , 中 心 极限 定理 也 可 以 保证 乏 和 立 几乎 服从 正 态 分 布 . 
一 旦 有 了 检验 统计 量 , 我 们 就 可 以 像 往常 那样 进行 假设 检验 . 下 面 通 过 一 个 例 
子 来 确保 你 清楚 了 一 切 . 
22.6.3 ”方差 未 知 且 不 相等 
我 们 已 经 讨论 了 如 何 处 理 方差 未 知 但 相等 的 情形 , 接 下 来 需要 讨论 的 最 后 一 种 
(也 是 最 一 般 的 ) 情形 是 , 我 们 既 不 知道 o2 也 不 知道 o2, 并 且 o2 可 能 不 等 于 o2. 
在 这 种 情况 下 , 需要 估计 两 个 方差 . 和 往常 一 样 我 们 计算 s2 和 s2, 并 用 它们 来 代 
替 o2 和 o2. 在 理想 的 情况 下 , 可 以 得 到 
(Zz—Y)— (Ks — Hy) 


入 党 
3 十 Sy 
Nz Ny 


将 服从 一 个 t 分 布 , 并 且 其 自由 度 可 以 很 容易 地 计算 出 来 . 不 幸 的 是 , 现在 的 情况 
并 不 理想 , 上 面 的 表达 式 是 不 成 立 的 . 为 什么 不 成 立 ? 回顾 一 下 前 面 的 内 容 , t 分 布 
的 定义 是 
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Z 
VY/n 
其 中 , 2 服从 标准 正 态 分 布 ,Y 服从 自由 度 为 的 x? 分 布 . 在 单 样本 情形 下 , 为 了 
证 明 把 o? 蔡 换 成 s? 会 得 到 一 个 t 分 布 , 我 们 必须 证 明 
(n—1)s? 本 
0o2 
现在 我 们 过 到 的 问题 是 : 之 前 可 以 说 2/n 是 x? 分 布 的 倍数 , 但 在 双 样 本 的 
情形 下 不 能 说 s2/mz 十 s2/ny 是 X2 分 布 的 倍数 , 这 样 就 无 法 断定 上 述 表 达 式 服从 + 
分 布 . 它 确实 服从 某 个 分 布 , 但 遗憾 的 是 , 它 无 法 用 我 们 熟知 的 分 布 来 很 好 地 描述 . 
那么 现在 该 怎么 办 呢 ? 一 般 来 说 , 在 数学 中 , 当 我 们 找 不 到 解析 表达 式 时 , 接 下 来 的 
最 住 选择 就 是 : 近似 . 值得 庆幸 的 是 , 在 这 种 情况 下 , 存在 一 个 大 家 熟知 且 易 于 使 
用 的 近似 , 即 在 方差 未 知 的 情况 下 , 检验 统计 量 
(z— DD)— (Ks — Hy) 


A tn, 


2 
n—1* 


2 

5 5 
六 2 
于 :大 
Nz Ny 


将 近似 服从 目 由 度 为 v 的 刀 分 布 , 其 中 


2 
AR 
-一 十 一 
mx Ny 


0 
n2 (nz — 1) | 7 (ny — 1) 


介绍 一 个 术语 , 这 个 近似 检验 被 称 为 Welch t 检验 . 因此 , 现在 几乎 是 一 种 理 
想 情形 一 一 检验 统计 量 几乎 服从 t 分 布 . 然而 , 你 会 注意 到 , 我 们 并 没有 “很 容易 
计算 的 自由 度 ”. 这 个 关于 > 的 表达 式 有 点 吓人 , 我 们 来 看 一 下 . 不 难 证 明 , > 的 上 
界 是 wz 十 ny 一 2, 下 界 是 min(nz - ly 一 1). 这 是 很 合理 的 , 因为 ” 不 应 该 大 于 
s2 与 s2 的 自由 度 之 和 , 也 不 应 该 比 我 们 考察 的 最 不 确定 的 度量 数 小 . 另 一 个 需要 
考虑 的 是 当 mx 很 大 时 的 情形 ( 当 mw 很 大 时 , 我 们 有 相同 的 论述 ). 当 nz 很 大 时 , > 
会 接近 于 n, 一 1. 这 很 好 , 因为 如 果 mwz 真 的 很 大 , 那么 就 不 用 担心 s2 的 不 确定 性 ， 
所 以 限制 因素 就 变 成 了 s2 的 自由 度 . 

你 想 问 的 男 一 个 问题 可 能 是 :“ 这 个 表达 式 是 不 是 总 能 给 出 一 个 整数 的 自由 度 ? 
如 果 不 是 的 话 , 非 整 数 的 自由 度 意味 着 什么 ?” 这 个 式 子 当然 并 不 总 是 返回 一 个 整 
数 ! 然而 , 当 它 给 出 > = 19.394 时 , 我 们 也 不 必 担 心 , 因为 这 只 是 一 个 近似 值 . 记 住 ， 
自由 度 的 典型 解释 是 能 够 用 于 度量 的 独立 观测 量 的 个 数 (在 这 种 解释 下 , 19.934 的 
自由 度 毫 无 意义 ). 但 如 果 使 用 这 样 的 近似 值 , 那么 上 述 解释 就 不 成 立 了 . 从 整个 表 
达 式 来 看 , 这 个 检验 统计 量 好 像 服从 一 个 “自由 度 ” 为 19.394 的 t 分 布 . 由 于 t 分 
布 的 公式 以 自由 度 为 输入 , 所 以 它 是 一 个 完全 定义 明确 的 数学 函数 . 
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一 旦 知道 了 检验 统计 量 以 及 它 (近似 ) 服从 的 分 布 , 我 们 就 可 以 像 之 前 那 相 
行 假设 检验 . 在 方差 未 知 且 可 能 不 相等 的 情况 下 , 我 们 对 双 样 本 检验 进行 总 结 . 
双 样 本 t 检验 


方差 未 知 且 可 能 不 相等 : 如 果 X 和 YY 是 相互 独立 的 随机 
变量 , 并 且 它 们 的 方差 分 别 是 o2 和 o2, 那么 


lL 进 


(ZC—)— (Ks — Hy) 


ty, 


5 S 


洗 V 


mx Ny 


2 
32 多 
SS 十 a 
Nr 4 
1 一 


二 (22.8) 
S57 于 Sy 
n2 (nz — 1) 


假设 : 与 之 前 一 样 , 需要 铸 和 YY 都 服从 正 态 分 
作为 一 个 例子 , 我 们 回 到 22.6.1 节 的 睡 


中 , 自由 度 > 等 于 


E 眼 研究 者 问题 . 
例子 : 重新 考察 22.6.1 节 关 于 睡眠 的 例子 . 


解答 : 我 们 之 前 给 出 的 分 析 仍 然 成 立 , 并 最 终 求 出 了 p 值 


. 提醒 一 下 , 我 们 知道 


Lz = 83.5, Wy = 75.4, s2 = 168.6, 


> sy = 73.32, 
以 及 jz 一 pw = 0 的 原 假设 . 检验 统计 量 为 
835_754 i 
/1686 7332 
TA 
但 是 , 我 们 还 需要 算出 自由 度 . 利用 式 (22.8) 来 计算 自由 度 , 得 到 
168.6 73.32\“ 
(e+) ee 
a 


142(14—1) 142(14—1) 
度 为 22.5 的 二分 布 ,二 为 1.95 时 所 对 应 上 


对 于 自 


的 p 值 是 0.0318. 因此 , 我 们 的 结 
果 有 点 不 确定 (> 检验 时 的 p 值 为 0.025). 但 是 , 在 5% 的 显著 性 水 平 下 , 我 们 仍然 
可 以 放心 地 拒绝 原 假设 . 


22.7 总 结 


本 章 讨论 了 统计 学 


与 假设 检验 相关 的 概率 . 我 们 考察 了 单 侧 z 检验 、 双 侧 > 
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检验 和 t 检验 ， 


设 的 值 , 但 双 侧 检验 只 确定 结果 是 否 


它们 都 用 来 检验 假设 的 真实 
要 假定 已 知 总 体 的 标准 差 , 但 t 检验 则 根据 样本 容量 


因素 , 通过 自由 度 来 调整 t 分 布 . 单 侧 检 验 用 3 


性 一 一 当 存 在 随机 性 


时 , 对 假设 进行 
量 以 及 其 他 各 种 


假定 假设 成 立 , 并 试 着 利用 收集 到 的 数 
值 ) 指 的 是 , 在 原 假设 成 立 的 前 提 下 , 茶 
界 值 ( 称 为 a 水 平 ) 时 , 我 们 可 以 得 到 
为 备 择 假设 成 立 . 

此 外 , 我 们 还 研究 了 如 何 计 算 检 验 统计 上 


并 被 量化 为 与 预 基 


的 标准 化 差异 


括 工 型 错误 和 II 型 错误 , 以 及 对 它们 的 一 
另外 , 我 们 还 讨论 了 检验 的 功效 , 以 及 它 是 如 何 与 效应 量 、 样 


据 来 扩 
值 远 


定 结果 是 否 严 格 大 于 或 小 于 原 假 
与 null 值 不 同 (大 于 或 小 于 ). 所 有 这 些 检验 都 
E 翻 假设 . 与 这 些 检验 相关 的 概率 值 (p 
离 观测 值 的 概率 . 当 这 个 值 低 于 某 一 临 
具有 统计 学 意义 的 证 据 来 推翻 原 假设 , 并 认 


. 然后 我 们 训 


时 ,它们 用 来 确定 观测 事件 的 稀缺 性 ， 


# 细 地 盖 述 了 p 值 
些 误解 , 比如 p 值 是 原 假设 成 立 的 概率 . 


及 相关 问题 , 包 


本 容量 


以 及 [I 型 错误 


(或 8) 相互 关联 的 . 最 后 , 我 们 讨论 了 卡 方 分 布 以 及 它 在 拟 合 优 度假 设 检 验 中 的 应 


用 . 


习题 22.8.1 ”假设 健 月 


习题 22.8.2 


被 抛 据 两 次 后 的 数字 和 是 16. 在 a = 0.05 的 4 


匀 的 ? 


习题 22.8.3 ”在 22.1.2 节 
到 45% 或 者 超过 55%， 


是 如 何 随 着 NN 的 增加 而 


22.8 习 


老人 的 收缩 压 是 服从 正 态 
患者 的 收缩 压 是 137, 那么 求 出 这 个 患 
这 个 人 的 血压 是 否 “ 正 


E 常 ”的 假设 . 
段 设 有 一 颗 8 面 的 山 子 , 我 们 把 它 抛 搓 了 两 次 . 原 假设 为 角子 是 均匀 的 . 般 和 了 
显著 性 水 平 下 , 这 是 否 足 以 证 明 骨 子 是 不 均 


P, 我 们 把 1 枚 均匀 人 硬 
那么 


的 2 值 ， 


题 


的 , 比如 N(110, 100). 如 果 医 院 里 有 一 个 


即 求 出 相应 的 p 值 并 用 它 来 检验 关于 


I 


I 


结果 就 是 不 寻常 的 . 当 


不 断 减 少 的 ? 为 了 有 


些 直观 的 了 解 , 看 看 


币 抛 奖 了 YN 次 , 并 指出 如 果 正 面 的 次 数 不 
NN 一 co 时 , 出 现 不 寻常 结果 的 概率 


名 


22-2 结果 的 对 数 


(因此 x 轴 是 对 数 , y 轴 则 是 概率 的 对 娄 

习题 22.8.4 如果 把 “ 令 人 惊讶 ”的 结果 定义 为 出 现 概 率 只 有 5% a 那么 当 把 一 
枚 均匀 硬币 抛掷 m” 次 时 , 画 出 可 以 被 称 为 “ 令 人 惊讶 ”的 正面 次 数 . 画 出 上 述 正面 次 数 作 
为 n 的 百分比 的 图 形 , 其 中 nw 在 5 和 100 之 间 取 值 . 

习题 22.8.5 ” 像 上 一 题 那 样 定 义 “ 令 人 惊讶 ”. 用 一 个 正 态 分 布 来 近似 正面 次 数 所 服从 的 分 
布 . 当 n 大 于 多 少时 ,“ 令 人 惊讶 ”的 正面 次 数 就 可 以 用 一 个 二 项 分 布 来 很 好 地 模拟 ? 


习题 22.8.6 ”证 明 : s? 是 o? 的 无 偏 估计 . 


习题 22.8.7 ”证 明 式 (22.4): 


22.8 习 题 603 
习题 22.8.8 ”我 们 证 明了 当 大 = 2 时 , 式 (22.6) 中 的 x? 统计 量 会 收敛 到 自由 度 为 1 的 x? 
分 布 . 证 明 : 在 一 般 情 况 下 , 这 个 统计 量 会 收敛 到 自由 度 为 一 1 的 x? 分 布 . 


习题 22.8.9 


证 明 : 当 v 一 co 时 ,+ 分布 会 趋向 于 标准 ] 


E 态 分 布 . 


习题 22.8.10 


假设 你 正在 进行 一 项 统计 检验 , 目的 是 为 


的 有 所 增加 , 或 者 就 \ 


变化 是 否 可 以 


么 ? II 型 错误 是 什么 ? 
习题 22.8.11 ”假设 有 人 


正在 向 你 推 


销 


了 确定 过 去 三 年 的 就 业 情 况 是 


Ey 


随机 波动 来 解释 ， 在 这 个 例子 中 ,I 型 错误 是 


能 够 轻易 掷 出 正面 的 硬币 .你 想 要 这 样 的 硬币 , 却 有 


什 


些 怀疑 . 为 了 验证 这 一 点 , 你 抛掷 便 币 500 次 并 得 到 了 0.043 的 p 值 . 你 可 以 从 这 个 发 现 


中 得 出 什么 结论 , 你 应 该 买 这 枚 硬币 吗 ? 


习题 22.8.12 ”最 近 一 项 研究 检验 了 今年 的 SAT 平均 分 是 否 比 去 年 有 所 提高 , 其 p 值 为 


0.031. 说 现在 有 更 多 聪明 人 参加 了 SAT 考试 的 观点 合理 
增加 功效 的 三 种 方式 是 什么 ? 请 
你 的 朋友 Bob 在 Twitter 上 很 受 欢迎 , 人 
仅 当 至 少 有 40% 的 粉丝 订阅 他 的 频道 时 , 他 才 会 把 
上 . 在 发 布 了 即将 推出 频道 的 状态 后 , 他 的 8353 名 粉丝 
Bob 应 该 花 时 间 来 经 营 他 的 YouTube 频道 吗 ? 利 ) 


22.8.13 
型 22.8.14 


最 佳 决策 方案 . 


习题 22.8.15 ”假设 我 们 在 花 匠 


种 了 


四 ? 


给 出 解释 . 


种 辣椒 , 它们 看 起 来 非常 相似 . 一 种 辣椒 很 辣 , 但 


也 正在 尝试 建立 一 个 YouTube 频道 . 
时 间 花 在 经 营 自己 的 YouTube 
PF 有 3530 人 表示 会 订阅 该 频道 . 
你 假设 检验 的 知识 来 告诉 Bob 他 的 


频道 


男 


一 种 不 辣 , 我 们 不 想 把 它们 搞 混 , 但 非常 遗憾 , 我 们 忘 了 给 它们 贴 上 标签 . 这 两 种 辣椒 的 


数量 相等 . 幸运 的 是 , 辣椒 要 


分 布 , 但 辣椒 的 平均 长 度 是 


辣椒 . 原 假设 为 这 根 辣椒 很 辣 . 如 果 辨 认错 误 , 我 们 就 会 受到 惩罚 ， 


比 甜 概 小 . 
英寸 , 而 甜 椒 


3 


入 错误 的 食物 中 . 当 它 是 辣椒 人 


甜 板 却 被 误 认 为 是 辣椒 , 那 


是 10. 为 随机 选 出 的 辣椒 长 度 设置 
你 的 朋友 (不 是 最 诚实 的 人 ) 声称 自己 撕 骨 子 时 得 到 数字 1、2、3、4、5 和 
的 概率 分 别 是 : 10%%、10%、10%、20%%、25% 和 25%. 在 掷 出 的 200 个 结果 中 
15 个 1、20 个 2、22 个 3、45 个 4、53 个 5 和 45 个 6. 你 


习题 22.8.16 


么 我 们 的 效 


个 


就 是 一 3 


! 被 误 认为 是 甜 柚 时 , 我 


仙界 值 ,从 而 使 我 们 


这 两 种 辣椒 的 长 度 都 服从 标准 差 为 1 英寸 的 正 态 
的 平均 长 度 是 4.5 英寸 . 我 们 随机 选 出 了 一 根 


因为 这 会 导致 它 被 放 


门 的 效 


函数 就 是 -5. 如果 它 是 
.如 果 能 正确 地 分 辨 它 , 我 们 的 效 


就 


函数 能 够 


取 到 最 大 值 . 


习题 22.8.17 “有 两 个 概率 论 雪 
均 分 是 84%、 标 准 差 是 9% 


f, 每 个 班 里 都 有 30 名 
, 而 第 二 个 班 的 平均 分 


表明 了 两 个 班 的 


很 大 不 同 ? 就 检验 条 们 


应 该 相信 你 


6 
,出现 了 
的 朋友 吗 ? 


a 


学 生 . 在 第 一 次 劳 试 中 ， 第 


是 90 另 、 标 ; 


佳 差 为 6%. 这 些 订 


习题 22.8.18 ”证 明 : 


当 了 一 co 时 ， 


自由 度 为 z 的 卡 


发 表 你 的 看 法 . 
方 分 布 收敛 到 正 


一 个 班 的 
据 是 否 


第 23 章 ”差分 方程 、 马 尔 可 夫 过 程 和 概率 论 


多 米 诺 骨 牌 效应 : 一 旦 你 投下 一 个 好 主意 , 其 他 的 就 会 随 之 而 来 . 
一 一 Loesje 基金 会 


购买 本 书 时 你 可 能 还 不 知道 , 我 将 分 享 一 个 在 轮 盘 赌 上 获胜 的 多 
外 的 奖励 . 你 可 以 蝇 无 风险 地 赚 几 百 万 . 习 
和 你 分 享 这 个 秘密 ), 我 将 立刻 飞 回 拉 斯 维 加 

可 莫 的 是 , 很 多 人 都 爱 上 了 这 村 
说 明 它 为 什么 不 是 . 我 喜欢 这 个 问题 的 原因 
我 们 无 须 大 量 的 数学 (或 博弈 ) 预备 知识 就 能 理解 它 . 具体 地 说 ， 
我 们 将 很 快 地 建 


下 


靠 的 、 安 全 的 ,并 
学 知识 有 关 , 而 且 


有 实 上 , 写 完 本 章 之 后 


斯 去 赚 更 


的 骗 


局 . 本 章 将 讨论 什么 检 


的 赌注 看 起 来 是 可 
是 它 与 许多 伟大 的 数 


( 


我 们 将 看 到 如 何 通 过 递 推 关 系 对 一 些 现实 世界 的 问题 进行 建 模 . 


立足 够 的 理 


是 可 以 


本 贡 的 目的 是 理解 


论 来 解决 一 些 有 趣 的 问题 , 并 厂 
简短 的 介绍 . 这 些 内 容 通常 会 涉及 离散 数学 或 微分 方程 , 它们 出 现在 本 书 中 的 原 
来 计算 我 们 感 兴趣 的 概率 . 


23.1 “从 斐 波 那 契 数 到 轮 盘 赌 


23.1.1 ” 翻 信 加 一 策略 


为 了 简化 讨论 , 我 们 将 考察 一 个 更 简单 的 轮 盘 赌 版 本 (参见 
盘 每 次 旋转 时 , 小 球 要 么 落 在 红色 的 数 上 , 要 么 落 在 黑色 的 数 上 ， 
4 况 会 更 复杂 一 些 , 但 我 们 接 下 来 描述 的 策略 也 适 
于 这 种 情况 ，( 真 实 的 轮 盘 赌 通常 有 18 个 红色 、18 个 黑色 和 2 个 绿色 的 数 , 所 以 
47.37%.) 为 了 让 问题 变 得 更 加 简单 , 我 们 只 


生 的 概率 都 是 50%. 


小 球 沙 在 红 


真实 的 性 


FE 本章 的 结尾 为 那些 想 了 解 曙 


名 妙 策 略 作为 额 


因为 我 很 无 私 , 想 


E 多 的 人 做 些 


天 


个 流行 的 轮 盘 赌 策略 , 并 将 它 与 之 前 见 到 的 斐 波 那 契 数 联 


图 23-1). 假设 轮 


并 且 每 种 避 


了 况 发 


色 和 黑色 数 上 的 概率 各 


允许 在 红色 或 黑 


色 的 数 


占 


上 下 注 ， 


并 别 


除 绿色 的 数 ( 绿 1 


用 


色 会 为 赌场 提供 巨大 的 优势 ). 


不 妨 设 我 们 在 红色 上 下 注 了 1 美元 (在 黑色 上 下 注 的 结果 是 相似 的 ) 如 果 小 球 落 


在 红色 的 数 上 , 那么 我 们 就 赢得 


美元 , 而 且 又 额外 赢得 了 1 美元 


赌注 . 


. 但 是 , 如果 小 球 落 在 黑 


上 了 1 美元 ， 这 意味 着 , 我 们 不 但 拿 


口 


色 的 数 


上 ,我们 就 会 失去 


了 原来 的 1 
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图 23-1 轮 盘 赌 轮 (图 片 来 自 Toni Lozano) 


显然 , 我 们 的 目标 是 赢 钱 . 有 一 个 著名 的 策略 叫 作 翻 倍 加 一 . 在 红色 上 下 注 1 
美元 . 如 果 结 果 是 红色 的 数 , 那么 非常 好 , 我 们 启 了 1 美元 . 如 果 不 是 , 我 们 将 失去 
1 美元 , 并 在 此 时 下 注 2 美元 . 如 果 我 们 说 了 , 那么 现在 一 共 多 得 了 1 美元 . 如 果 输 
了 呢 ? 如 果 输 了 , 我 们 就 损失 了 3 美元 . 在 这 种 情况 下 , 我 们 选择 下 注 4 美元 . 如 
果 这 一 次 说 了 , 那么 我 们 现在 就 赚 了 1 美元 (之 前 损失 了 3 美元 , 现在 只 说 了 4 美 
元 , 所 以 多 了 1 美元 ). 如 果 输 了 , 那么 就 损失 了 7 美元 , 接 下 来 下 注 8 美元 . 

这 种 策略 的 模式 应 该 是 非常 清晰 的 . 我 们 把 赌注 翻 倍 , 直到 启 为 止 . 如 果 启 了 ， 
我 们 就 可 以 收回 所 有 的 损失 并 额外 多 赚 1 美元 . 红色 的 数 最 终 应 该 会 出 现 , 所 以 我 
们 最 终 应 该 能 赚 到 1 美元 . 接 下 来 , 只 需要 不 断 地 重复 这 个 过 程 , 直到 赚 到 我 们 想 
要 的 钱 数 为 止 . 

这 种 做 法 有 什么 问题 ? 有 两 个 问题 , 其 中 一 个 只 需要 一 些 常 识 , 而 另 一 个 则 需 
要 了 解 拉 斯 维 加 斯 是 如 何 运作 的 (以 及 他 们 为 什么 会 听 数 学 家 的 ). 当然 , 第 一 个 问 
题 是 , 在 某 些 时 候 可 能 需要 下 注 1 267 650 600 228 229 401 496 703 205 376 美元 (或 
2100 美元 ), 但 我 们 “可 能 ”没有 那么 多 钱 ! 为 了 不 去 担心 这 种 “小 事 ”, 我 们 假定 你 
有 一 个 很 富有 却 非常 古怪 的 阿姨 或 权 叔 . 这 种 家 庭 成 员 拥 有 无 限 的 资金 储备 , 并 且 
会 提供 我 们 所 需 的 任何 金额 来 下 注 , 却 不 会 直接 给 我 们 1 美元 . 他 们 为 什么 不 只 给 
1 美元 ? 这 超出 了 本 书 的 范围 , 我 们 只 关注 这 里 的 数学 问题 ! 之 所 以 假设 有 一 个 富 
有 且 古 怪 的 阿姨 或 叔叔 是 为 了 消除 我 们 需要 大 量 资金 的 困难 , 从 本 质 上 . 允许 我 们 
可 以 无 限 下 注 . 但 在 分 析 了 这 个 问题 之 后 , 我 建议 你 对 论述 进行 修改 , 进而 考察 当 
资金 固定 且 有 限时 的 情形 . 另外 , 即使 在 这 样 一 个 有 利 的 条 件 下 , 我 们 也 甚至 可 能 
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赚 不 到 钱 .……… 


另 一 个 问题 是 什么 ? 事实 说 


就 会 陷入 困 


台 蕊 上 


用 十 


日 


日 


个 


个 黑 
3 


了 出现 
果 输 了 , 我 们 会 损失 惨重 . 


上 


如 


这 个 自然 且 非 常 重要 


的 概率 是 多 少 ? 有 趣 的 是 , 我 


用 来 解决 这 个 问题 . 


再 回 到 轮 盘 赌 . 


大 


口 


此 , 我 们 要 和 暂 集 一 下 , 快速 


23.1.2 “对 斐 波 那 契 数 的 快速 回顾 


我 们 简单 地 回顾 一 下 斐 波 那 契 数 列 , 但 刚 开 始 似乎 看 不 到 什么 关联 . 斐 波 那 契 
数列 指 的 是 数列 到 =0、 玉 =1、B=1、FB=3、=5、fs=8 和 ,2 


E 明 , 这 个 问题 要 严 习 


30 美元 . 在 这 科 
境 . 此 时 , 我 们 会 损失 1 十 2: 
现在 应 该 下 注 32 美元 , 但 是 只 能 下 注 30 


门 研究 斐 波 那 


如 何 下 注 . 实际 上 , 每 个 赌场 都 设 定 了 你 在 某 一 轮 中 可 以 下 注 的 下 限 和 上 限 . 
下 限 可 能 是 1 美元 , 而 上 限 可 
是 黑色 , 那么 我 们 
按照 我 们 的 方法 ， 
整个 策略 失效 . 如 
了 , 我 们 赢得 很 少 ; 

这 说 明了 下 面 
色 数 | 


E 得 多 . 我 们 还 没有 过 多 地 讨论 


例如 ， 


情况 下 , 如 果 前 5 轮 的 结果 都 
H4 十 8 十 16 = 31 美元 . 
美元 , 这 会 导致 我 们 的 
色 , 我 们 就 会 遇 到 更 大 的 麻烦 . 问题 在 于 , 如 果 遍 


的 问题 : 如 果 下 注 n 次 , 那么 连续 出 现 5 个 
站 数 的 数学 思路 也 可 以 


顾 斐 波 那 契 数 的 相关 内 容 , 然后 


41 十 x. 这 是 一 个 线性 递 推 关 系 (也 称 为 差分 方程 ) 的 例子 . 这 种 关系 是 线性 的 ， 


明 请 
见 性 的 灵感 来 


因为 未 知 项 与 之 前 的 项 线 怕 


EE 相关. 注意, 这 里 没有 彼此 相 
指数 . 解决 这 个 问题 的 方法 有 很 多 种 . 利用 生成 函数 就 是 
参阅 19.2 市 ), 但 由 于 时 


乘 的 : 
一 种 4 
司 关 系 并 为 了 保持 各 章 的 独立 性 , 现在 我 们 利用 有 预 


项 , 也 没有 某 一 项 的 
民 棒 的 方法 (相关 证 


[HI 


然 , 问题 在 于 , 我 们 通常 很 难 


区 


7 乘 以 前 一 项 . 如 果 我 们 有 更 
为 每 一 项 都 是 前 一 项 的 2 倍 . 
这 两 个 结果 强烈 地 表明 了 ， 
7, 使 得 对 于 较 大 的 mw， 


猜 


LI 


不 妨 设 存在 某 个 ", 使 得 马 , = mm". 这 种 猜测 是 合理 


类 


以 地 , 如 果 考 察 万 


斐 波 那 契 数列 呈 指 数 型 : 


想法 , 而 这 
如 果 存 在 这 检 
如 果 把 i 


有 


里 的 目标 


定 有 V2<r<2. 


称 为 递 推 关系 式 的 特征 多 项 式 . 


FE 明 . 从 本 质 上 说 , 这 种 方法 就 是 先 猜 答案 , 然后 证 明 你 是 对 的 ! 显 


道 数 学 难题 的 答案 ! 实际 上 , 存在 一 大 类 可 以 直 


有 五, s Crn. 这 一 点 非常 重要 , 稍 后 我 们 将 进 
是 向 你 快速 展示 如 何 看 待 相关 问题 才能 
的 7, 那么 
文 个 猜想 代入 北 


接 正确 猜 出 答案 的 问题 . 对 于 那些 希望 看 到 更 多 一 般 理 论 的 读者 , 请 继续 阅读 23.2 


的 . 它 意 味 着 每 一 项 都 等 于 
简单 的 关系 式 Gu = 2G。 那么 解 就 是 G。 = 2", 因 
11 二 2,_1, 那么 有 HH, = V3 . 


增长 . 这 意味 着 存在 常数 C 和 


步 阐述 这 种 
直观 的 了 解 . 注意 ， 


关系 式 ,42 = P41 十 Fx, 那么 会 得 到 7"+? = 77 十 
r7?. 这 个 式 子 可 以 简化 成 =7 二 1, 即 一 r+ 一 1 = 0. 利用 二 次 公式 可 知 , 上 述 方程 


两 个 根 : m = (1 十 V 引 /2 守 1.618 和 mm = (1 一 V5)/2 污 一 0.618. 多 项 式 r2 -rr 一 1 
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递 


事实 表明 , 对 于 一 个 线性 递 推 关系 式 , 其 特征 多 项 式 的 解 的 任何 线性 组 合 都 是 


关系 式 的 解 . 换 句 话说 , 对 于 任意 的 ct 和 co, 如 果 令 及 +a = c17? 十 c273, 那么 


你 会 发 现 上 述 递 推 关系 式 仍 然 成 立 , 这 是 因为 mm 和 rs 都 是 其 特征 多 项 式 的 解 . 对 


这 
换 
这 


这 一 点 进行 验证 是 个 不 错 的 主 


言 之 , cl+cz =0 | 
样 就 得 到 了 下 面 的 比 内 公式 . 


意 , 能 让 我 们 了 解 线性 性 质 是 如 何 发 挥 作 用 的 . 虽然 
里 的 cl 和 co 可 以 任 取 , 但 我 们 希望 数列 从 n= 0 时 的 0 以 及 n=1 时 的 1 开始. 
量 cri 十 c272 二 1. 求 出 ci 和 co 的 值 , 我 们 有 ci ca = 1/V5. 


比 内 公式 : 设 nr2 = Fn+1 | Fn, 


其 中 而 =0 且 玉 =1. 于 是 


m1/itviy 1 /1i-viy 
” v5\ 2 v5\ 2 | 


线 


如 果 
论 一 般 | 


四 


性 递 推 关系 式 的 方法 就 行 了 . 


现在 感到 有 些 难 以 理解 也 不 必 担 心 , 我 们 将 在 后 面 更 详细 、 更 从 容 地 讨 
尤其 是 斐 波 那 契 数列 ， 现 在 ,你 只 需要 知道 存在 一 个 求解 
比 内 公式 非常 有 用 .利用 该 公式 , 我 们 可 以 直接 


计算 Fioo 而 不 需要 考察 所 有 的 中 


的 , 但 是 即使 不 知 
用 递 推 关 系 式 Fy2 = Fri 1 


道 这 些 先 进 的 到 


间 项 . 当然 ,能 够 避免 烦琐 的 代数 运算 是 非常 好 


354 224 848 179 261 915 075. 
有 必要 简单 地 说 明 一 下 有 预见 性 的 灵感 , 是 什么 让 我 们 认为 an = 六 会 是 一 个 
很 好 的 猜想 ? 我 们 回顾 一 下 上 面 的 论述 . 斐 波 那 契 级 数 是 严格 增加 的 , 所 以 五,_2 < 
1< Pb. 由 B= Fit+ FP 2 可 和 0, 


E 论 ， 只 要 有 耐心 也 可 以 求 出 Fioo. 只 要 继续 使 
+- ,我 们 就 能 求 出 越 来 越 多 的 项 , 最 终 得 到 Fioo = 


27 2 < I < 27 1. 


经 过 一 些 代数 运算 之 后 , 我 们 看 到 世 , < 27. 瑟 的 下 界 并 不 容易 看 出 来 . 从 2,_2 < 


五 ,中 不 六 
到 了 


们 


4% 旦 


可 


人 看 出 , 下 标 每 增加 2, 斐 波 那 契 数 就 至 少 翻 倍 . 沿 着 这 种 思路 往 后 推 , 我 


FP > 2F, 2 > 2 4 > 2 6 > .> 272h, 


2 
可 能 不 是 这 样 , 比如 它 可 能 与 V3 log(n) 的 增长 速度 一 致 .) 对 于 较 大 的 w 比 内 公 
式 表 明了 瓦 +1 大 概 比 及 大 志江 ,注意 , 这 个 常数 约 等 于 1.618 03, 它 完美 地 介 
于 下 界 Vs 1.414 和 上 界 2 之 间 . 


办 出 


,我 们 猜 


想 斐 


(上 式 至 少 在 ”为 偶数 时 成 立 ). 当然 , 我 们 可 能 希望 提前 一 步 停止 ( 即 停 在 局 处 而 
不 是 而 处 , 因为 而 = 0). 换 名 话说, 记 , > 2"/2 = (V2)”. 我 们 把 第 ”个 斐 波 那 契 
数 夹 在 了 两 个 指数 表达 式 之 间 , 它 的 增长 速度 至 少 与 (V2)"” 一 样 快 , 最 多 不 会 超过 
波 那 契 数列 的 增长 速度 与 茶 个 r” 一 样 是 很 合理 的 . (当然 , 也 
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23.1.3 “” 递 推 关系 与 概率 


为 什么 递 推 关 系 对 解决 轮 盘 赌 问题 有 帮助 ? 试 着 计算 一 下 , 在 ” 轮 中 , 至 少 连 
续 5 次 的 结果 都 是 黑色 数 的 概率 . 我 们 把 这 个 概率 记 作 an 实际 上 , 计算 如 会 更 
容易 些 , 它 表示 在 n 轮 中 , 没有 出 现 至 少 连续 5 次 的 结果 是 黑色 数 的 概率 . 注意 , an 
就 等 于 1 一 b. 所 以 , 如 果 能 求 出 其 中 一 个 , 也 就 得 到 了 另外 一 个 . 这 是 概率 论 中 的 
一 个 强大 原则 , 即 互补 事件 的 概率 之 和 为 1. 它 还 有 其 他 的 名 字 , 比如 全 概率 法 则 . 
我 们 利用 这 一 原则 来 求 出 b,, 的 递 推 关系 式 . 在 图 23-2 中 , 我 们 画 出 了 在 轮 盘 赌 中 
会 发 生 什 么 . 


b, 
功 
人 人， 
功 bn_1 ~ 
hb 
:OY 
功 BD 咀 


图 23-2 在 n 次 轮 盘 赌 中 ,“ 没 有 出 现 连续 5 次 得 到 黑色 数 ” 的 递 推 关系 式 


b 是 多 少 ? 第 1 轮 有 两 种 可 能 的 结果 , 每 一 种 结果 的 概率 都 等 于 1/2. 我 们 有 
一 半 的 概率 得 到 红色 的 数 , 为 一 半 的 概率 得 到 黑色 的 数 . 如 果 已 知 第 1 轮 得 到 了 红 
色 的 数 , 那么 在 n 轮 中 , 我 们 没有 连续 5 次 得 到 黑色 数 的 概率 是 多 少 ? 这 个 问题 的 
答案 就 是 b,_1， 由 于 第 1 轮 的 结果 是 红色 , 所 以 它 不 能 对 5 个 连续 的 黑色 结果 产 
生 任 何 影 响 . 现在 来 分 析 当 第 1 轮 得 到 了 黑色 数 时 , 接 下 来 会 发 生 什么 . 第 2 轮 有 
两 种 可 能 的 结果 , 并 且 每 一 种 结果 发 生 的 概率 同样 是 1/2: 得 到 1 个 红色 的 数 , 得 
到 1 个 黑色 的 数 . 如 果 我 们 第 1 轮 得 到 了 黑色 的 数 , 接着 又 得 到 了 1 个 红色 的 数 ， 
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那么 这 种 情形 发 生 的 概率 是 3.3= 3. 接 下 来 , 没有 连续 5 次 得 到 黑色 数字 的 概率 
就 是 bn—2. 
按照 这 种 思路 继续 进行 下 去 , 我 们 会 得 到 
1 1 1 1 1 
bn 一 bn-1 | 本 bn- gon-3 | 160"4 | 32 "5 

我 们 为 什么 会 得 到 这 个 式 子 ? 为 什么 没有 更 多 项 ? 如 果 前 5 次 的 结果 都 是 黑色 的 ， 
那么 “没有 连续 5 次 得 到 黑色 数 ” 的 情况 就 不 可 能 出 现 ! 正 因 如 此 , 我 们 才 想 到 计 
算 如 而 不 是 won. 现在 , 我 们 得 到 了 递 推 关 系 式 . 剩 下 的 就 是 找到 初始 条 件 . 做 到 这 
一 点 并 不 难 , 初始 条 件 就 是 

bo b1 b2 b3 ba 1. 


它们 为 什么 都 等 于 1? 如 果 轮 盘 赌 的 总 次 数 少 于 5, 那么 就 不 可 能 至 少 连续 5 次 得 
到 黑色 结果 ! 我 们 既 可 以 修改 高 等 理论 , 也 可 以 使 用 递 推 关 系 式 来 求 出 如 或 an. 
经 过 一 些 代数 运算 之 后 , 我 们 看 到 an 就 是 
1 3 1 5 3 7 255 571 
32” 64’ 16’ 64’ 32’” 64’ 2048’ 4096’” 


0, 0, 0, 0, 0, 
或 者 写成 小 数 形式 
0, 0,0,0,0,0.031 25, 0.046 875, 0.0625, 0.078 125, 0.093 75, 0.109 375, 0.124 512,.... 


当 n= 100 时 , 至 少 连续 出 现 5 个 黑色 数 的 概率 是 81.01%. 当 n = 200 时 , 这 个 概 
率 上 升 到 96.59%, 但 当 n= 400 时 , 这 个 概率 就 变 成 了 99.89%. 
23.1.4 ”讨论 与 推广 
这 个 轮 盘 赌 问题 有 许多 漂亮 的 特性 , 我 们 可 以 从 中 提取 出 一 个 很 好 的 数学 公 
式 . 没有 太 多 的 困难 就 可 以 轻松 地 编写 一 个 简单 的 程序 , 利用 递 推 关 系 式 和 初始 条 
件 来 求 出 概率 . 但 这 仅仅 说 明了 在 概率 论 中 可 能 出 现 的 各 种 数学 问题 中 的 一 小 部 
分 . 另外 , 它 还 说 明了 选取 正确 对 象 的 重要 性 . 如 果 我 们 研究 的 是 没有 连续 出 现 5 
个 黑色 结果 的 概率 , 而 不 是 至 少 连 续 出 现 5 个 黑色 数 的 概率 , 那么 递 推 关 系 式 就 简 
单 多 了 . 
最 后 , 我 们 再 给 出 这 个 问题 的 一 个 特性 . 假设 我 们 想 求 出 在 100 次 轮 盘 赌 中 ， 


没有 连续 出 现 5 个 黑色 结果 的 概率 . 可 以 建立 递 推 关系 式 并 求 出 这 个 概率 , 但 是 如 
果 没 有 找到 递 推 关 系 式 呢 ? 有 什么 方法 可 以 估计 概率 吗 ? 估计 是 一 项 极其 重要 的 技 
能 , 优秀 的 工程 师 在 这 方面 做 得 非常 出 色 , 而 你 也 可 以 在 工作 和 实践 中 逐渐 做 到 这 
一 点 . 我 们 来 看 一 下 这 个 概率 的 下 界 是 什么 . 

假设 我 们 把 100 次 轮 盘 赌 划分 成 了 20 组 , 每 组 包含 5 轮 (参见 图 23-3). 在 每 
一 组 的 5 轮 中 , 没有 连续 出 现 5 个 黑色 结果 的 概率 是 31/32, 这 是 因为 得 到 “黑色 
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黑色 , 黑色 , 黑色 , 黑色 ”的 概率 只 有 1/32. 要 想 确保 任何 地 方 都 不 会 连续 出 现 5 个 
黑色 结果 , 我 们 显然 要 保证 在 这 20 组 中 , 任何 一 组 都 不 能 连续 出 现 5 个 黑色 的 结 
果 . 所 有 组 都 没有 连续 出 现 5 个 黑色 结果 的 概率 就 是 


1 N100/n 31\ 20 
(1- 豆 ) 二 (号 ) 久 0.529 949. 


这 是 bioo 的 上 界 , 因为 有 可 能 连续 出 现 5 个 黑色 结果 , 其 中 3 个 黑色 结果 属 了 
某 一 组 ， 而 另外 2 个 黑色 结果 属于 相 邻 的 另 一 组 ， 于 是 , b100 才 0.529 949, 所 以 
ai00 之 0.470 051; 或 者 说 , 至 少 连续 出 现 5 个 黑色 结果 的 概率 不 小 于 47%. 


图 23-3 通过 把 100 次 轮 盘 赌 划分 成 20 组 , 其 中 每 组 包含 5 轮 , 求 出 概率 的 下 界 


我 非常 喜欢 上 面 的 论述 , 并 强烈 建议 你 多 读 几 裔 , 直到 完全 和 弄 清 楚 发 生 了 什么 
为 止 . 注意 , 我 们 绕 过 了 许多 高 等 数学 的 知识 , 并 很 快 得 到 了 一 个 大 致 的 答案 . 对 于 
一 个 复杂 问题 , 能 够 迅速 找到 答案 的 近似 解 , 确实 会 让 人 很 有 成 就 感 . 
只 要 多 做 一 点 工作 , 就 能 得 到 比 47% 更 好 的 结果 . 我 们 重新 考虑 在 100 次 轮 
盘 赌 中 , 至 少 连 续 出 现 5 个 黑色 结果 的 概率 的 下 界 . 现在 , 我 们 不 把 这 100 次 轮 盘 
赌 划分 成 每 组 5 轮 的 20 个 组 , 而 是 把 它 划 分 成 每 组 长 度 为 6 的 16 个 互 不 相交 的 
组 和 1 个 长 度 为 4 的 组 . 对 于 长 度 为 6 的 组 , 证 明 “ 没 有 至 少 连续 出 现 5 个 黑色 
结果 ”的 概率 是 61/64, 并 利用 这 个 结果 求 出 aioo 的 一 个 下 界 . 如 果 有 足够 的 耐心 ， 
你 可 以 把 100 次 轮 盘 赌 划分 成 每 组 长 度 均 为 10 的 10 个 互 不 相交 的 组 , 然后 把 所 
有 可 能 的 结果 列举 出 来 (这 个 过 程 不 会 有 太 多 麻烦 ), 进而 求 出 aaioo 的 一 个 非常 漂 
亮 的 下 界 . 如 果 进 行 计算 的 话 , 你 会 发 现在 10 次 轮 盘 赌 的 1024 个 可 能 的 结果 中 ， 
至 少 连续 出 现 5 个 黑色 数字 的 结果 恰好 有 112 个 . 这 样 就 得 到 了 下 界 68.60%, 它 与 
实际 结果 81.01% 相差 不 远 . 同样 毫 不 奇怪 的 是 , 我 们 仍然 低估 了 真实 概率 . 

我 们 的 整个 分 析 是 为 了 求 出 在 ”次 轮 盘 赌 中 , 至 少 连 续 出 现 5 个 黑色 结果 的 


概率 . 如 果 想 知道 在 ”次 抛 扼 中 , 恰好 连续 出 现 5 次 正面 的 概率 , 那么 这 个 概率 应 
该 是 多 少 呢 ? 有 一 种 很 好 的 方法 可 以 求 出 这 个 值 . 我 们 只 需要 求 出 至 少 连续 出 现 5 
个 黑色 结果 的 概率 , 然后 再 让 它 减 去 至 少 连续 出 现 6 个 黑色 结果 的 概率 即 可 . 
23.1.5 “” 轮 盘 赌 问题 的 代码 


最 后 , 我 们 给 出 一 些 简单 的 Mathematica 代码 来 解决 轮 盘 赌 问题 . 第 一 种 方法 
是 利用 递 推 关 系 式 直接 计算 . 用 b,, 表示 没有 连续 出 现 5 个 黑色 结果 的 概率 . 我 们 
可 以 把 递 推 公 式 写 成 下 列 紧凑 形式 


I 
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5 
= > (1/2)*2 
k=1 
注意 , 如 果 把 6 用 它 前 面 的 项 来 表示 , 而 不 是 用 如 +1, 那么 关系 式 会 更 整洁 一 些 
我 们 注意 到 前 5 项 (从 bo 开始 ) 都 等 于 1, 然后 会 逐 项 递减 . 
b[0] = 1; 
b[1] = 1; 
b[2] = 1; 
b[3] = 1; 
b[4] = 1; 
= 1/2; 
For[n = 5, n <= 100, n++, 
brn] = Sum[p“k b[n - k], {k, 1, 5}] 
J 
上 述 内 容 给 出 了 , 在 100 次 轮 盘 赌 中 连续 出 现 5 次 黑色 结果 的 概率 , 即 1 一 bi00, 等 
下 64 183 494 979 494 598 846 972 364 275 
79 228 162 514 264 337 593 543 950 336 
(如 果 不 需 要 那么 精确 的 话 , 这 个 值 约 为 81.011%! ) 
当然 , 我 们 也 可 以 模拟 这 个 概率 . 在 100 次 轮 盘 赌 中 , 我 们 记录 了 连续 出 现 5 
个 黑色 结果 的 次 数 , 并 用 变量 count 来 表示 这 个 值 (所 以 , 这 种 情况 每 出 现 1 次 ， 
count 就 加 1). 我 们 把 出 现 黑色 记 作 1, 出 现 红 色 记 作 0. 我 们 把 连续 黑色 的 个 数 记 
作 consec (于 是 , consec 从 0 开始 . 如 果 得 到 了 一 个 黑色 , 计数 器 consec 会 增加 
1, 但 如 果 得 到 了 一 个 红色 , 那么 就 将 其 重 置 为 0). 下 面 会 用 到 一 个 While 命令 . 当 
轮 盘 赌 的 总 数 小 于 100 次 并 且 没 有 连续 出 现 5 个 黑色 结果 时 , 我 们 会 继续 进行 下 
去 ; 只 要 有 一 个 条 件 不 满足 , 就 立即 终止 计算 , 因为 没有 必要 继续 下 去 一 一 此 时 


大 


是 否 连 色 疆 


引 


我 们 已 经 知道 出 现 了 5 个 黑色 结果 . 


roulette [numspins_，numdo_] := Module[{}, 


count = 0; 
For[n = 1, n <= numdo, n++, 
{ 
consec = 0; 
spin = 1; 
While[consec < 5 && roll <= numspins, 
{ 


toss 


If[Random[] <= .5, 1, 0]; 


If[toss == 1, consec 


consec + 1, consec = 0]; 


612 第 23 章 差分 方程 、 马尔 可 夫 过 程 和 概率 论 
spin = spin + 1; 
}; (* 结束 while 循 环 *) 
If[consec == 5, count = count + 1]; 
站]; (* 结束 对 n 的 循环 *) ; 


Print["Observe at least 5 heads in a row with prob "， 


100. count/numdo, "%."]; 


ls 


Timing[roulette[100, 1000000]] 
Observe at least 5 heads in a row with prob 81.044%. 


因此 , 我 们 看 到 了 理论 与 模拟 之 间 的 良好 一 致 性 . 


23.2 ” 弟 推 关系 的 一 般 理 论 
我 们 已 经 看 到 了 递 推 关系 在 概率 论 中 的 威力 . 利用 递 推 关系 , 我 们 分 析 了 轮 盘 


赌 问题 并 发 现 


种 看 似 确 


及 递 


关系 ,了 解 与 之 相关 的 更 多 信 ， 


与 递 推 关系 有 关 的 事实 . 


23.2.1 ”表示 法 


阶 线性 递 


并 且 ci,c2,… ,cp 是 一 些 固 


个 数列 {an}%2o, 其 中 


上 保 赚钱 的 方法 实际 上 却 有 致命 的 缺陷 . | 
息 是 个 不 错 的 主意 . 接 下 来 , 我 们 会 给 出 


于 很 多 问题 都 涉 
些 


在 建立 相关 理论 之 前 , 我 们 先 设置 一 些 表示 法 .我们 要 研究 线性 递 推 关 系 .K 


an+l = CiQn + CoQn— 


定 的 已 知 实数 . 


如 


所 有 项 就 都 被 唯 
到 二 0 且 丰 = 
0, 1, 1, 2,3, 


从 某 种 意义 上 说 , 我 们 已 经 阐述 完了 . 


5, 8, 13, 


有 有 
1， 这 样 束 得 到 了 递 
21,34,55,… ,其 


公式 瓦 ,| 


CkQn—k+1 (23.1) 


果 指 定数 列 的 前 大 项 , 那么 其 余 
定 下 来 了 ， 例 如 , 对 于 斐 波 那 契 数 列 , 有 = 2, cl = c2 = 1 
人 
中 每 一 项 (从 第 3 


1， 这 个 序列 就 是 
项 开始 ) 都 是 前 2 项 之 和 |. 


且 玫 


有 后 续 项 六 
呢 ? 主要 的 原 


能 对 


项 计算 . 


it 都 是 唯一 有 
因 是 效率 . 从 轮 盘 赌 问题 中 不 》 
个 特定 项 , 希望 能 够 直接 求 出 它 , 而 不 必 考 察 前 四 
序列 的 一 般 项 具有 的 性 质感 兴 
确 地 计算 出 来 ? 基于 这 些 原 因 


23.2.2 ”特征 方程 
在 本 节 中 , 了 解 一 些 线性 代数 的 知识 是 有 帮助 的 , 但 并 不 必要 . 我 们 会 快速 地 


定 了 递 推 关 系 式 和 初始 条 件 


人 丰 


, 所 


定 的 . 既然 如 此 , 我 们 为 什么 要 花 时 间 去 建立 一 个 高 等 理论 
人 E 看 出 , 我 们 可 能 只 关心 序列 深 处 的 茶 
的 所 有 项 . 与 之 相关 的 是 , 我 们 可 
. 能 否 得 到 它们 的 一 般 性 质 , 而 不 必 把 各 项 精 
, 我 们 确实 需要 找到 一 种 更 好 的 方法 , 而 不 仅仅 是 逐 
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回顾 这 门 课 中 有 助 于 理解 下 文 的 一 些 想法 . 如 果 没 学 过 这 些 内 容 , 你 可 以 跳 过 或 快 
速 浏览 下 一 段 , 也 可 以 把 它 看 作 一 个 简单 的 介绍 ! 
在 线性 代数 中 , 对 于 任意 的 常数 a,b 和 任意 的 向 量 已 她 如 果 算 子 了 满足 : 


T(ad + 00) = aT(D) + TD), 


那么 了 就 是 线性 的 . 当 了 是 一 个 矩阵 时 , 我 们 通常 会 把 括号 去 掉 , 只 写 45 使 
用 这 种 写法 的 一 种 情况 是 从 一 个 特定 解 过 渡 到 一 般 解 . 例如 , 假设 我 们 正 试 着 求解 
Az = 二 b. 首先 要 找到 4 的 零 空间 的 一 组 基 ( 零 空 间 是 指 , 在 4 的 作用 下 , 被 映射 到 
0 的 全 体 向 量 所 构成 的 集合 ), 不 妨 设 页 ,… ,可 是 一 组 基 . 接 下 来 , 我 们 要 找到 原 方 
程 的 一 个 特 解 . 也 就 是 说 , 我 们 要 找到 一 个 向 量 也 使 得 47 = 5 于是, 如 果 了 是 
AZ = 的 一 个 解 , 那么 存在 一 组 常数 cl,，… , ou, 使 得 


T= 了 十 QUl 十 … 二 Qe 


这 一 结果 的 奇妙 之 处 在 于 , 我 们 可 以 将 某 些 问题 的 解 结合 起 来 , 从 而 找到 所 需 问题 
的 全 体 解 . 按照 类 似 的 思路 , 我 们 可 以 将 线性 递 推 关 系 的 特定 解 组 合 起 来 从 而 得 到 
它 的 所 有 解 . 

回 到 式 (23.1), 我 们 看 一 看 如 何 把 aj, 写成 的 函数 , 并 找到 c 及 初始 条 件 
( 即 ao0,a1,… ,ap-1 的 值 ). 首先 , 我 们 猜想 aj, = r”, 其 中 7 是 某 个 常数 ， 这 就 是 
前 面 提 到 的 有 预见 性 的 灵感 方法 (我 们 也 可 以 使 用 19.2 节 的 生成 函数 法 来 找到 答 
案 ). 事实 表明 , 我 们 总 能 得 到 式 (23.1) 的 一 个 解 , 但 现在 还 要 做 些 工 作 来 满足 初始 
条 件 . 

把 ow,==7? 代入 式 (23.1) 可 得 


rmtl 六 cir” 六 cor™-!1 十 …… .十 cer Ktl. (23.2) 
把 上 式 两 端 同 时 除 以 r”-*+l, 式 (23.2) 就 变 成 了 
Te = clr 十 ca 2 十 .十 ck (23.3) 


我 们 把 式 (23.3) 称 为 差分 方程 式 (23.1) 的 特征 多 项 式 . 等 号 两 端 同时 减 去 curA -1+ 
cork-2 十 .… 十 ch, 式 (23.3) 就 可 以 改写 成 


jclrprl crt ?2 -ch = 0. (23.4) 


式 (23.4) 是 一 个 天 次 多 项 式 , 由 代数 基本 定理 (对 该 定理 的 回顾 , 请 参阅 20.10 
节 ) 可 知 , 它 有 & 个 根 . 不 妨 把 这 些 根 记 作 71,72,… ,mr 注意 , 这 些 根 可 能 不 
是 互 不 相同 的 .实际 上 , 如 果 有 重 根 ,分 析 就 会 更 加 困难 . 现在 , 我 们 假设 这 些 根 
71)72， ”7 彼此 不 同 . 
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中 1 < i < k. 每 个 x; 都 是 特征 多 项 
的 代数 运算 得 到 的 由 于 我 们 求解 
m2 都 是 式 (23.1) 的 解 , 那么 它 
也 就 是 说 , 对 于 任意 的 常数 


我 们 知道 , a = r? 是 式 (23.1) 的 解 
式 的 解 , 而 特征 多 项 式 是 通过 对 式 (23.2) 做 简 身 
的 是 一 个 线性 差分 方程 , 所 以 一 旦 知道 了 Ss 7 
们 的 线性 组 合 也 一 定 满足 式 (23.1) (参见 习题 23.5. 69). 


NL Yo 


) Yk, 


qn = N+ 


是 递 推 关 系 的 一 个 解 . 这 是 因 


为 最 初 的 递 


十 Yerk 


例如 ,如 果 递 


(23.5) 


2 Nn 
Qn+tl = NAn TE Qn-l 


E 关 系 的 解 . 


那么 式 (23.5) 就 不 是 该 递 
对 于 斐 波 昼 


契 数 列 , 我 们 来 详细 地 证 


明 这 一 点 . 总 的 来 说 , 证 明 是 相似 的 . 斐 
波 那 契 数 列 的 特征 方程 是 吃 -=-1= 0 它 的 根 是 7 


(+V5)/2 和 ra 


(1 一 V5)/2. 既然 知道 了 每 个 根 都 能 解 出 特征 方程 , 我 们 来 看 看 任意 一 个 线性 组 合 
也 ,二 9477 十 Y272. 于 是 有 
Parti Pn = Pe 
= (qr + rt ) — (qr + Yrs) — (qr + yr2 1!) 
se a 1 
二 Yr? (7¥ 71 1) 十 ?ar2 ( 吗 一 72 一 1) 一 0+0 = 0. 


这 里 的 代数 运算 利 
23.2.3 ”初始 条 件 


用 了 线性 性 


距离 求 出 式 (23.1) 的 解 , 我 们 大 概 已 经 完成 了 2/3. 现在 


质 : 解 的 和 仍然 是 解 , 解 的 倍数 也 仍然 是 解 . 


E, 我 们 已 经 得 到 了 an 


的 一 般 形式 , 即 式 (23.5), 还 求 出 了 特征 多 项 式 的 根 71,72,… ,7 (假设 它们 互 不 相 
同 ). 不 幸 的 是 , 我 们 尚未 完成 . 要 想 求 出 ou, 还 要 确定 ,7Y2,… ,Yi 的 值 . 
利用 初始 条 件 ( 即 a0,a1,… ,api 的 值 ) 以 及 假设 on = 人 位 十 十 Try 我 
们 可 以 建立 下 列 方程 组 
7 十 ?2 十 :十 三 Q0 
?171 十 ?272 YkeTh 一 CQ1 
7 7272 Yerk 二 Q2 
yrt 1 4 yrs A 十 RAT 1 一 ok 
由 线性 代数 可 知 , 这 个 方程 组 可 以 改写 成 矩阵 的 乘积 
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1 1 1 Y1 ao 
71 72 TE 了 2 Q1 
2 2 2 
7 fo 和 ?3 | = a2 |. (23.6) 
ET | 大 一 1 
7 72 Ey Yk Qk—1 


这 里 有 一 个 奇妙 的 事实 : 如 果 mra，…… ,rk 互 不 相同 , 那么 上 面 的 有 x 阶 算 
阵 就 是 可 逆 的 . 这 个 事实 是 不 平凡 的 , 真正 感 兴趣 的 读者 可 以 阅读 23.2.4 节 中 的 证 
明 . 在 这 种 情况 下 , 把 式 (23.6) 的 两 端 同时 左 乘 上 述 &k x 矩阵 的 逆 和 矩阵 , 就 可 以 
求 出 以 ,7y2，,… ,Yr 为 分 量 的 向 量 : 


= 
1 1 1 1 Q0 
?2 71 72 Tk Q1 
5 2 2 
?3 | = 7 fo a2 |. (23.7) 
kl1 kl k—1 
Yk 7 To Ue Qk—1 


于 是 , 式 (23.7) 给 出 了 1,7y2,… ,Ys 的 值 . 既然 求 出 了 71,72,… ,ri 那么 由 式 (23.5) 
可 知 , 现在 已 经 得 到 了 计算 a,, 所 需 的 全 部 信息 . 也 就 是 说 , 我 们 把 通过 求解 特征 多 
项 式 得 到 的 ~ 以 及 利用 式 (23.7) 得 到 的 yi 代入 式 (23.5), 就 求 出 了 an 

最 后 , 我 们 把 这 个 结果 应 用 到 斐 波 那 契 数列 上 . 回忆 一 下 , ri = (1 + V5)/2， 
72 二 (1 一 V5)/2, 初始 条 件 为 而 =0, 丽 =1 以 及 及 = 六 他 十 or 上 面 的 方程 组 


就 变 成 了 
Ce 


上 述 和 矩阵 的 行列 式 等 于 ro 一 ri = -V5. 因为 这 个 值 不 为 0, 所 以 这 个 矩阵 是 可 逆 
| 
72 V5\-r 1 1/ | —1/v5/ 


二 (3 1 (与) 
” v5 2 V5 2 | 
我 们 重新 得 到 了 上 比 内 公式 . 这 是 一 个 惊人 的 公式 , 允许 我 们 直接 跳 到 任何 斐 波 那 契 
数 , 而 不 需要 计算 中 间 项 . 这 使 得 计算 效率 大 幅 提 高 . 

我 们 将 轮 盘 赌 剩 下 的 问题 作为 一 个 练习 留 给 感 兴趣 的 读者 . 这 里 的 难点 在 于 ， 
特征 多 项 式 的 次 数 为 5 现在 无 法 像 二 次 公式 那样 来 求解 . 很 遗憾 , 这 意味 着 我 们 
无 法 只 利用 多 项 式 的 系数 写 出 方程 的 解 , 而 必须 求 出 解 的 近似 值 . 这 5 个 根 的 近似 
值 分 别 是 -0.339 175 土 0.229 268i, 0.097 688 3 土 0.424 427i 和 0.982 974. 


这 样 就 得 到 了 
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在 分 析 递 推 关系 式 的 解 时 , 大 n 项 的 性 质 通 常 由 绝对 值 较 大 的 根来 控制 . 这 是 
因为 , 随 着 n 的 增加 , 这 个 根 的 作用 会 远 远 超过 其 他 根 . 只 有 当 它 的 相应 系数 恰好 
为 0 时 (这 种 情况 只 发 生 在 特殊 的 、 病态 的 初始 条 件 下 ), 它 才 不 会 对 极限 过 程 产生 


影响 . 
23.2.4 ”关于 不 同根 意味 着 可 逆 性 的 证 明 


为 了 求解 递 推 关系 式 , 式 (23.7) 中 的 x 阶 矩 阵 必 须 是 可 逆 的 . 我 们 要 证 明 
的 是 , 如 果 


1 1 a 1 
7T1 72 Tk 
2 2 2 
AS= Wl 72 大 
rk—1 zk rk—1 


那么 4 是 可 逆 的 , 当 且 仅 当 根 是 互 不 相同 的 . 这 是 一 种 非常 特殊 的 矩阵 , 叫 作 范 德 
蒙 和 矩阵 . 事实 上 , 通过 一 个 简单 的 参数 匹配 就 可 以 证 明 , 如 果 根 互 不 相同 , 那么 这 个 
矩阵 就 是 可 逆 的 . 

在 线性 代数 中 , 你 学 过 (或 将 会 学 到 ) 一 个 方 阵 是 可 逆 的 , 当 且 仅 当 它 的 行列 式 
不 为 0. 如 果 有 两 个 根 相 等 , 那么 矩阵 有 两 列 是 相同 的 , 所 以 和 矩阵 不 可 逆 . 因此 , 我 
们 可 以 只 考察 所 有 根 都 互 不 相同 的 情形 . 

由 线性 代数 (主要 利用 子 式 展开 ) 可 知 , det(4) 是 rira……，,k 的 函数 . 另外 ， 
我 们 知道 在 计算 x 阶 和 矩阵 的 行列 式 时 , 有 KL 个 被 加 数 , 并 且 每 个 被 加 数 都 是 天 
项 的 乘积 . 对 于 每 一 个 乘积 , 我 们 总 是 从 每 行 中 取出 一 个 元 素 , 并 且 从 每 列 中 取出 
一 个 元 素 . 我 们 会 得 到 一 个 关于 71,72,… ,rx 的 烦琐 多 项 式 . 现在 要 问 的 第 一 个 问 
题 是 : 这 个 多 项 式 的 次 数 是 多 少 ? 第 一 行 元 素 全 都 是 1, 所 以 它们 对 次 数 没有 任何 
贡献 ; 第 二 行 会 给 出 某 个 ri, 这 会 使 次 数 加 1; 在 第 三 行 中 , 我 们 会 选 出 一 个 r3, 这 
将 导致 次 数 加 2; 依 此 类 推 , 直到 最 后 一 行 , 我 们 会 得 到 一 个 rh-1, 从 而 使 得 次 数 增 
加 有 一 1. 因此 , det(4) 的 次 数 等 于 


(关于 这 个 和 的 证 明 , 请 参阅 A.2.1 节 ). 我 们 知道 det(4) 是 关于 让,72,.… ,mk 的 多 
项 式 . 接 下 来 证 明 这 个 行列 式 就 是 “| 一) 

1&i<ij<k 
稍 等 一 下 , 我 们 回 过头 来 看 看 如 果 存 在 某 个 i 六 j, 使 得 7; = 7+, 那么 会 发 生 什 
么 . 在 这 种 情况 下 , 因为 有 两 列 元 素 相等 , 所 以 det(4) = 0. 由 于 i 和; 是 任意 的 ， 
所 以 det(4) 总 能 被 x; 一 7 整除 , 或 者 说 ”村 (mj 一 7) 可 以 整除 det(A4). 


1<&i<ij<k 
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现在 , 我 们 知道 了 [[ ( 


1<&i<jij<k 


i) 的 次 数 . 我 位 有 2 和 7 和 和 1T<i 和 7 一 1. 因 


k 
(7—1) 
j=2 


不 难看 出 ， 


;一 7i) 是 det(4) 的 


IT[ Gj 一") 的 次 数 与 det(4) 的 次 数 相等 


因子 , 接 下 来 考察 ”| 
1<i< 7 去 大 


此 , 这 个 多 项 式 的 次 数 等 于 
是 


—1 


ys 
j=1 


1&i<j<k 


det(A) 


II (ry — Ti), 


1<&i<j&k 


中 可 以 看 出 , 具有 当 a = 0 或 者 IT 

1<&i<j&k 

[= = 0. 此 时 , det(4) 也 等 于 
1&i<j<k 


0. 但 是 , 我 们 要 考察 的 是 有 个 不 同根 的 情况 . 因此 , 我 们 假设 ][] ( 


1<i<J<K 7 
接 下 来 , 必须 要 证 明 a 取 0. 非常 棒 的 一 点 是 , a 与 7; 无关. 因此 , 如 果 能 求 出 某 种 
特殊 情形 下 的 a, 就 得 到 了 任意 情形 下 的 a 值 . 

我 们 尝试 令 x; = 1019”. 这 个 序列 的 增长 速度 非常 快 . 现在 有 ri = 10, ra = 
1010 和 rs = 10100, 等 等 . 显然 , rj 会 变 得 非常 大 , 从 而 使 得 行列 式 不 可 能 为 0 ( 实 
际 上 , 行列 式 就 等 于 r&r373 .re 9) 所 以 我 们 不 可 能 得 到 a = 0. 因此 , 有 大 个 不 
同 的 根 ri,ra，… ,rp 足以 说 明 4 是 可 逆 的 . 

我 们 有 必要 停 下 来 思考 一 下 上 面 的 论述 . 通过 考察 一 种 特殊 情形 , 我 们 可 以 推 
断 出 一 般 结 果 . 具体 地 说 , 我 们 想 证 明 a 不 等 于 0. 我 们 已 经 把 与 m 相关 的 所 有 项 
都 分 离 了 出 来 , 所 以 现在 要 做 的 就 是 找到 一 种 使 得 行列 式 不 为 0 的 特殊 情形 , 然 


后 
从 中 推导 出 a 夫 0. 考察 极端 情形 通常 会 很 有 用 , 我 们 可 以 把 对 一 种 情形 的 认识 
直观 了 解 过 渡 到 一 般 情形 中 去 . 


口 


]A 人 AN 


中 , a 是 一 个 常数 . 从 式 (23.8) 


会 等 于 0. 如 果 Ti = Ty, 那么 


l 


时 , det(A) 


ea 


人 
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最 后 , 我 们 用 一 个 例子 来 说 明 差 分 方程 是 如 何 应 用 在 概率 论 上 的 . 我 们 从 一 个 
完全 确定 且 极其 简单 的 情况 开始 , 在 理解 了 这 个 问题 后 , 我 们 会 让 模型 更 加 合理 , 然 
后 探讨 相关 的 应 用 . 

23.3.1 ” 递 推 关 系 与 种 群 动力 学 

假设 鲸 是 成 对 交配 的 , 并 且 总 
全 性 .我们 给 出 下 列 假设 . 


对 或 两 对 鲜 , 每 对 都 有 一 头 雄 性 和 一 头 


L -二 
是 生育 


二 
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。 鲸 总 是 在 出 生 之 后 满 4 年 时 死亡 . 
。 第 2 年 初 , 每 对 鲸 都 生 下 两 对 饥 . 
。 第 3 年 初 , 每 对 鲸 都 生 下 一 对 使. 


e。 第 4 年初 , 鲸 不 再 生 


育 , 开始 享受 做 祖父 母 的 生活 . 
。 鲸 在 出 生 后 的 第 5 年 初 死 亡 . 


我 们 可 以 利用 递 推 关系 式 来 


述 , 在 每 个 时 间 段 里 , 每 种 类 型 的 鲸 有 多 少 条 . 


用 a 表示 第 ”年 初出 生 的 鲸 数 量 , 加 表示 第 n 年 初 1 岁 鲸 的 数量 , cn 表示 第 n 
年 初 2 岁 鲸 的 数量 , d,, 表示 第 n 年 初 3 岁 饼 的 数量 , en 表示 第 n 年 初 4 岁 鲸 的 数 


我 们 的 假设 经 含 了 以 下 关系 . 


为 什么 会 有 这 样 的 关系 ? 对 于 第 n 十 1 年 出 4 


量 . 我 们 不 必 担 心 在 第 n 年初 5 岁 鲸 的 数量 , 因为 (很 遗憾 ) 它们 会 立即 死亡 . 


- 2cn41 加 dn+1 一 20mn 十 Cn 


= 的 鲸 , 它们 的 父母 是 这 一 年 初 2 岁 或 


3 岁 的 鲸 , 但 是 对 于 第 n 二 1 年 初 2 岁 的 鲸 , 它们 在 第 ” 年初 是 1 岁 . 同样 地 , 第 


nn 二 1 年初 4 岁 的 鲸 在 第 ”年 初 是 3 岁 . 1 


系 写 成 
或 者 
Qm 十 1 
bn+1 
Cn 二 1 二 
dn+1 
En+l1 


和 矩阵 4 有 一 个 很 好 的 结构 . 
通过 友 代 , 我 们 发 现 


此 可 得 en41 = dn. 我 们 可 以 把 这 种 关 


Qnil 20， 十 cn 

pn 二 1 Qn 

cnt+l | 三 bn ) 

dn+1 Cn 

En+l dn, 

0 2 1 0 0 Qn Qn 
1 0 0 0 0 bn bn 
0 1 0 0 0 Cn = A| cn 
0 0 1 0 0 dn dn 
0 0 0 1 0 en En 
这 种 矩阵 在 种 群 动力 学 中 经 常 出 现 , 称 为 莱 斯 利 矩阵 . 
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Qni1 Q0 

bn1 bo 

cn | = A"t! | co |， 

an+1l do 

CEm 十 1 €0 

革 中 ,最 后 一 个 向 量 是 在 第 0 年 各 年 龄 的 鲸 的 数量 
这 个 公式 的 美妙 之 处 在 于 , 我 们 可 以 通过 计算 矩阵 4 的 高 次 容 来 确定 未 来 几 


年 的 综 的 数量 . 这 是 书写 巴 


关系 式 的 一 种 非常 紧凑 的 好 方法 . 它 概括 了 我 们 之 前 


所 做 的 事 . 例如 , 如 果 回 


La 


出 


a 


由 此 可 以 


到 斐 ; 


皮 那 契 数列 , 我 们 有 请 ,42 = 41 十 可, 于 是 


Fn 


+ 了 Fl 


Fn 


Fnt1 
I 


) 


不 是 完全 确定 的 ，( 除 非 我 们 想 
头 鲸 恰好 3 岁 的 概率 是 多 少 ?”) 当 和 矩阵 4 的 元 素 为 


1 


( 


J (a a 


1 0 
pe 2 Be 
Fp 


a 
Fo 


因此 , 我 们 也 可 以 利用 这 个 框架 来 求 斐 波 那 契 数 
这 为 什么 会 属于 概率 论 ? 实际 上 , 这 个 过 程 
问 :“ 在 第 n 年 , 随机 选择 的 一 


随 忆 
来 ， 


变量 时 , 这 就 真正 二 


b 变 成 了 一 个 概率 问题 . 我 们 
并 且 在 第 5 年 初 死亡 , 而 是 假设 饼 具 有 
表示 i 岁 的 鲸 可 以 活 到 i+1 岁 的 概率 . 同样 地 , B; 表示 一 头 i 岁 的 饺 所 生育 的 


不 假设 每 头 鲸 每 年 都 能 存活 下 
定 的 死亡 率 . 设 Ri 是 一 个 随机 变量 ， 


鲸 的 对 数 . 现在 , 矩阵 4 的 元 素 都 是 随机 变量 ! 我 们 得 


为 了 弄 清 楚 系 统 是 如 何 演 


到 了 下 列 形式 的 矩阵 乘积 
0 DB B 0 0 
R 0 0 0 0 
0 R 0 0 0 
0 0 Rs 0 0 
0 0 0 R 0 
化 的 , 我 们 需要 了 解 以 随机 变量 为 元 素 的 矩阵 乘积 的 性 
质 ! 现在 , 我 们 有 很 多 问题 可 以 问 . B 和 R 的 分 布 是 如 何 影 响 鲸 种 群 的 长 期 性 态 


上 且 
里 


的 ? 这 些 随机 变 


问题 需要 我 们 了 解 更 多 内 容 ， 
23.3.2 
马尔 可 夫 过 程 非常 重要 ， 


是 否 存 在 临界 值 ， 从 而 使 得 均值 的 微小 变换 导致 截然 不 
果 ? 这 就 引出 了 一 个 非常 活跃 的 下 


同 的 结 


究 领域 “随机 和 矩阵 理论 . 虽然 进一步 研究 这 些 
但 我 希望 你 能 知道 问题 的 发 展 方向 


一 般 的 马尔 可 夫 过 程 


我 们 起 码 应 该 简单 


也 提 及 并 讨论 , 而 且 要 看 一 看 上 述 


问题 是 如 何 与 这 个 框架 相 拟 合 的 . 马尔 可 夫 过 程 本 质 上 是 这 样 一 个 系统 : 为 了 预测 
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n 二 1 时 刻 的 行为 ,关键 是 看 它 在 n 时 刻 的 状态 换 句 话说, 知道 如 何 到 达 n 时 刻 
的 状态 并 不 能 为 预测 下 一 刻 会 发 生 什么 提供 任何 额外 的 信息 . 如 果 X; = z 表示 系 
统 在 i 时刻 所 处 的 状态 是 zi 那么 可 以 把 这 个 条 件 写成 


Prob(Xn+i = Zn+HiXn = rn ,Xo= x0) = Prob(Xn+li = ZnHXn = zn). 


如 果 从 正确 的 角度 来 考察 , 递 推 关系 就 是 一 个 极 好 的 例子 . 我 们 来 看 一 看 斐 波 
那 契 数列 : 局 = 末 十 玉 并 且 而 =0, 玉 =1. 因为 下 一 个 状态 取决 于 之 前 的 
两 个 状态 , 所 以 它 不 满足 马尔 可 夫 过 程 的 定义 , 但 我 们 可 以 通过 一 个 简单 的 修改 来 
使 其 满足 . 令 
Fn 
i Eo 


1 0 
Vn+1l 二 1 1 Un. 


人 口 问题 通常 可 以 被 看 作 马 尔 可 夫 过 程 , 习题 23.5.16 就 是 这 样 一 个 例子 . 关 
于 马尔 可 夫 过 程 的 极限 性 质 有 大 量 定理 , 我 强烈 建议 你 查阅 一 些 网 络 资料 并 从 中 学 
到 更 多 . 


于 是 


23.4 总 结 


本 章 简要 地 介绍 了 递 推 关 系 , 但 即使 是 粗略 的 介绍 也 是 以 让 你 看 出 这 些 方 法 的 
威力 和 适用 性 . 我 喜欢 引 自 Loesje 的 这 句 话 :“ 多 米 诺 骨 有 牌 效 应 ; 一 旦 你 投下 一 个 
好 主意 , 其 他 的 就 会 随 之 而 来 .” 这 从 两 个 方面 体现 了 递 推 关 系 . 第 一 个 方面 比较 明 
显 : 在 递 推 关系 中 , 一 旦 知道 了 前 面 儿 项 以 及 事物 之 间 是 如 何 联系 的 , 你 就 可 以 轻 
松 地 计算 出 后 面 的 项 . 这 使 得 递 推 关系 非常 适合 计算 机 . 

第 二 个 方面 是 , 好 想法 以 及 从 正确 角度 考察 问题 的 重要 性 . 我 们 已 经 在 书 中 见 
过 这 样 的 例子 . 如 果 从 正确 的 角度 考察 问题 , 就 能 轻松 地 解决 代数 运算 , 我 们 就 可 
以 看 到 问题 的 本 质 . 线性 代数 为 研究 递 推 关系 提供 了 各 种 工具 . 把 线性 代数 与 概率 
论 相 结合 是 一 种 很 好 的 思路 , 这 样 系数 就 能 被 看 作 随 机 变量 . 当 引 入 了 随机 值 之 后 ， 
我 们 就 离开 了 确定 过 程 的 世界 , 并 有 了 更 好 的 机 会 来 建立 合理 的 模型 . 当然 , 这 些 


只 是 一 个 大 主题 的 开始 . 


23.5 习 题 


习题 23.5.1 ”考虑 下 面 的 骗局 : 一 个 无 道德 的 人 试图 让 你 相信 他 是 挑选 股票 的 高 手 . 在 七 周 
内 , 他 会 发 送 给 你 一 份 关于 股票 的 预测 , 并 且 准确 地 (免费 ) 告诉 你 股票 会 涨 还 是 会 跌 . 当 


23.5 习 题 621 


这 七 周 的 准确 预测 结束 时 , 他 告诉 你 , 现在 要 花 100 美元 来 购买 他 的 建议 , 你 应 该 支付 
吗 ? (提示 : 请 注意 , 他 可 能 也 在 联系 其 他 人 , 不 一 定 会 给 他 们 同样 的 建议 . ) 
习题 23.5.2 假设 存在 常数 C1 CT 使 得 


an+l 三 clan 十 c2an-1 十 :… 十 cran-(-1) 


对 所 有 的 nn 均 成 立 . 如 果 77,… ,7? 是 这 个 北 推 关系 式 的 解 , 证 明 : an = Qi7? 十 …: 十 Qur” 
也 是 这 个 递 推 关 系 式 的 解 , 其 中 a1,… , a 是 任意 值 . 

习题 23.5.3 ”证 明 : 对 于 任意 的 整数 n, 比 内 公式 都 会 返回 一 个 整数 . (这 个 结论 更 好 ,因为 
所 有 斐 波 那 契 数 都 是 整数 ! ) 

习题 23.5.4 ”利用 比 内 公式 , 证 明 : 对 于 较 大 的 n, Fr1/ Fs 趋向 于 黄金 分 割 点 世人 . 

习题 23.5.5 ”利用 特征 多 项 式 , 找到 满足 ou+l = 2an + an_1 的 函数 方程, 其 中 初始 条 件 为 
ao 王 0 和 al = 1. 

习题 23.5.6 ” 找 出 递 推 关系 式 an+i = 2an 一 an-1 的 显 式 公式 , 其 中 fo = 1, 有 =2. 

习题 23.5.7 ” 设 一 个 递 推 关系 式 的 特征 多 项 式 有 一 个 d 重 根 7. 证 明 : nir” 是 递 推 关 系 式 的 
解 ,其 中 1e {0,1,… ,4d 一 1 

习题 23.5.8 ” 抛 描 一 枚 均匀 硬币 100 次 , 求 出 至 少 搓 出 5 个 正面 的 最 长 游程 的 概率 . 

习题 23.5.9 “” 抛 括 一 枚 均匀 硬币 100 次 , 求 出 恰好 掷 出 5 个 正面 的 最 长 游程 的 概率 . 

习题 23.5.10 ”重新 考虑 前 两 道 题 . 现在 假设 硬币 掷 出 正面 的 概率 是 20/38. 我 们 可 以 把 答案 
解释 为 , 如 果 人 允许 出 现 两 个 绿色 的 数 , 那么 对 轮 盘 财 的 分 析 会 发 生 什 么 ? 

习题 23.5.11 ”抛掷 一 枚 均匀 硬币 100 次 , 在 5 次 连续 执 搓 中 , 从 来 没有 出 现 过 4 次 反面 的 

概率 是 多 少 ? 如 果 抛 搓 n 次 呢 ? 你 能 写 下 这 个 问题 的 递 推 关系 式 吗 ? 

习题 23.5.12 ”我 们 修改 一 下 轮 盘 赌 问题 . 现在 仍然 假设 有 50% 的 概率 出 现 红色 , 但 只 有 当 

连续 6 轮 下 注 中 至 少 出 现 5 个 黑色 结果 时 , 我 们 才 会 破产 . 在 100 次 轮 盘 赌 中 , 我 们 破 
产 的 概率 是 多 少 ? 

习题 23.5.13 ”考虑 23.2.4 节 的 范 德 蒙 矩阵 , 求 出 a 


习题 23.5.14 考虑 参数 为 71,… ,rn 的 范 德 蒙 矩 阵 . 把 第 大 行 的 (rm) 蔚 换 成 
(m2 一). 732%). 这 个 行列 式 还 会 有 一 个 很 好 的 公式 吗 ? 如 果 是 , 请 找 出 这 个 公式 . 
习题 23.5.15 。” 设 A(71,… ,rn) 是 参数 为 71,… ,rn 的 范 德 蒙 矩 阵 ，B(sl, ,sn) 是 参数 


为 s1,… ,sn 的 范 德 蒙 矩阵 . 用 mm ,sn 来 表示 A(71,… ,Tn)B(s1,… ,sn) 的 行列 
式 . 
习题 23.5.16 ”假设 世界 上 最 初 有 100 万 人 , 其 中 700 000 人 生活 在 弗 里 多 尼 亚 , 300 000 人 
生活 在 西 尔 瓦 尼 亚 . 每 年 年 底 , 生活 在 弗 里 多 尼 亚 的 人 有 80% 仍 住 在 弗 里 多 尼 亚 , 其 余 
的 人 则 移居 西 尔 瓦 尼 亚 , 而 生活 在 西 尔 瓦 尼 亚 的 人 有 70% 仍 住 在 西 尔 瓦 尼 亚 (其 余 的 人 
都 搬 到 了 弗 里 多 尼 亚 ). 假设 没有 人 出 生 或 死亡 , 那么 10 年 后 , 随机 选 出 的 一 个 人 居住 在 
弗 里 多 尼 亚 的 概率 是 多 少 ? 20 年 后 呢 ? 当时 间 趋 向 于 无 穷 大 时 , 情况 又 如 何 ? 
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最 小 二 乘法 是 确定 数据 最 佳 拟 合 线 的 一 种 方法 ， 划 
代数 ， 基 本 问题 是 
ne {1,.… ,N}. 该 方法 可 以 轻松 地 


函数 妈 不 一 定 是 关于 x 的 线 全 
章 是 对 你 在 本 书 以 及 更 早 以 前 学 到 的 数学 知识 的 很 好 应 用 ， 这 
问题 合集 , 而 是 让 你 了 解 一 个 最 习 
顾 . 除了 建立 理论 以 及 考察 一 些 例 子 外 , 我 们 还 


确保 你 掌握 基本 知识 的 经 典 
本 章 的 独立 性 , 首先 进行 简要 的 回 


最 小 二 乘法 


证 明 会 用 到 微 积分 和 线性 


找到 给 定 观 测 值 (zx%,yn) 的 最 佳 拟 合 直线 y = az 十 5, 其 中 


y = 0 万 (Z) 十 


广 到 找 昌 


= cK jx(z). 


FE 隙 数 ,只 需要 y 是 这 些 函 数 的 


下列 形 式 的 最 佳 拟 合 


线性 组 合 . 所 以 , 本 
部 分 内 容 不 是 为 了 


要 的 应 用 . 为 了 保持 


会 讨论 可 用 于 曲线 拟 合 的 替代 方法 . 特别 是 , 我 们 将 花费 大 量 时 间 来 研究 什么 是 正 


确 的 统计 量 ， 


并 权衡 不 同方 案 的 优 缺 点 . 


24.1 


问题 的 描述 


在 现实 世界 中 , 人 们 通常 希望 找到 变量 之 间 的 线 怕 


EE 关系. 例如 , 弹簧 的 力 与 弹 


簧 的 位 移 是 线性 相关 的 : y = kz (其 中 , y 是 力 , x 是 弹簧 的 位 移 , k 是 弹 得 常数 ). 为 


了 检验 这 一 关系 , 研究 者 去 实验 室 测 量 了 不 同位 移 的 力 . 
(zn;yn) 的 数据 , 其 中 ms {1,… ,NN}, yn 


位 是 牛顿 . 
遗憾 的 是 , 我 


实验 误差 ; 二 是 潜在 的 关系 可 能 不 
子 是 物体 下 落 时 受到 的 力 . 最 初 , 我 们 将 力 近 似 为 PF = my， 


然而 , 这 并 不 是 完全 正 


5 时 , 弹簧 的 位 移 与 力 的 模拟 数据 妇 


最 小 二 乘法 是 


es 
是 完全 


外 的 , 因为 还 存在 一 


门 几乎 不 可 能 观察 到 完美 的 线性 关系 . 这 有 两 个 原 
线性 的 , 而 是 近似 线 怕 


因此 , 他 们 收集 到 了 形 如 
是 当 弹 得 移动 了 zj, 米 时 观测 到 的 力 , 单 


其 


一 


个 取决 于 速度 的 阻力 .) 当 弹 簧 常数 等 于 
[图 24-1 所 示 . 

个 过 程 , 只 需要 利用 微 积 分 与 线 
数据 的 “最 佳 拟 合 ” 线 . 当然 , 我 们 要 
和 统计 知识 进行 简要 的 回顾 . 
仔细 地 分 析 其 证 明 , 我 们 不 难 发 现 该 方法 具有 很 强 的 推广 性 . 我 们 不 寻找 最 佳 


生 代数 的 知识 , 它 就 可 以 确定 
对 “最 佳 拟 合 ” 进 行 量化 , 这 需要 对 一 些 概率 


的 . (一 个 经 典 的 例 
中 9 是 重力 加 速度 . 


I 


拟 合 线 , 而 是 可 以 找到 这 样 一 种 最 佳 拟 合 : 指定 函数 的 任何 一 种 有 限 的 线性 组 合 . 


因此 , 一 般 化 的 问题 是 : 给 定 函 数 及 ,… , fg, 找到 系数 ai，… ,axk, 使 得 线性 组 合 


24.2 ”概率 论 与 统计 学 回顾 ”623 


y = arfi(z)+:… +arfx(z) 


是 对 数据 的 最 佳 逼 近 . 


100 上 
80r 
60r 
40r 
20r 


5 10 15 20 


图 24-1 位 移 和 力 的 100 组 “模拟 ”观测 数据 ( = 5) 


24.2 ”概率 论 与 统计 学 回顾 


我 们 快速 地 回顾 在 最 小 二 乘法 中 所 需 的 概率 论 与 统计 学 的 基本 知识 .给 定 一 
列 数据 z1,… ,zn, 把 它们 的 均值 (或 期 望 值 ) 定义 为 (zi 十 … 十 ZN)/N. 这 个 量 用 


均值 就 是 这 些 数据 的 平均 值 . 

考虑 下 面 两 列 数据 : {10, 20,30, 40,50} 和 {30, 30, 30,30,30}. 这 两 个 集合 有 相 
同 的 均值 , 但 是 第 一 个 集合 中 的 数据 围绕 均值 有 较 大 的 变化 . 这 就 引出 了 方差 的 概 
念 , 它 是 一 种 有 用 的 工具 , 用 来 量化 一 组 数据 围绕 其 均值 的 波动 程度 . {zx1,… ,ZN} 
的 方差 记 作 o2, 即 


标准 差 cz 是 方差 的 平方 根 : 


@ 对 于 那些 了 解 高 等 统计 学 的 读者 : 出 于 技术 原因 , 样本 方差 的 准确 定义 应 该 是 除 以 N 一 1, 而 不 是 
除 以 N. 
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] 
ox 一 2 (nr — TD)?. 


驳 二 于 
注意 , 如 果 z 的 单位 是 米 , 那么 方差 oz 的 单位 是 平方 米 , 标准 差 cx 与 均值 
的 单位 都 是 米 . 因此 , 标准 差 可 以 很 好 地 衡量 xz 围绕 均值 的 偏离 程度 , 因为 它 与 我 
们 感 兴趣 的 量具 有 相同 的 单位 . 
当然 , 我 们 也 可 以 考察 其 他 量 . 例如 , 可 以 研究 


N 


不 六 的 是 , 这 是 一 个 带 符 号 的 量 , 大 的 正 偏差 可 以 与 大 的 负 偏差 相互 抵消 . 事实 上 ， 
利用 均值 的 定义 , 可 以 马上 推出 上 式 等 于 0! 所 以 , 这 是 度量 数据 可 变性 的 一 种 粳 
料 工 具 , 因为 无 论 数据 值 是 多 少 , 它 始终 为 0. 

我 们 可 以 用 绝对 值 来 修正 这 个 问题 . 这 样 就 需要 考 


1 N 
去 2 ln -| (24.1) 
n=1 


虽然 这 可 以 避免 误差 之 间 相 互 抵消 (并 且 与 xz 的 单位 相同 ), 但 绝对 值 函数 并 不 容 
易 分 析 . 它 是 不 可 微 的 . 因此 , 我 们 将 考虑 标准 差 ( 即 方差 的 平方 根 ) 一 一 这 样 就 可 
以 使 用 微 积分 工具 了 . 

现在 , 我 们 来 量化 所 谓 的 “最 佳 拟 合 ” 如 果 我 们 相信 Y = azx+b, 那么 y 一 (az 十 妇 
应 该 是 0. 因此 , 对 于 给 定 的 观测 值 


区 


G 


{(z1,91), *** , (ZN, YN)}, 
我 们 看 一 看 
{V1 3 (az1 十 0), BN (QZN 十 b)}. 
它 的 均值 应 该 很 小 (如 果 这 是 一 个 不 错 的 拟 合 ), 而 且 这 些 项 的 平方 和 将 衡量 这 个 
拟 合 有 多 好 . 
我 们 定义 


El(a,b) := (yn — (arn +b)). 


交 寺 十 

大 误差 的 权重 要 比 小 误差 的 更 大 (因为 平方 ). 因此 , 这 个 过 程 适用 于 中 等 误差 而 非 
一 些 大 误差 . 如 果 用 绝对 值 来 测量 误差 (参见 式 (24.1)), 那么 所 有 误差 的 权重 都 是 
相等 的 . 通过 取 绝 对 值 , 我 们 可 以 避免 上 述 问题 . 但 遗憾 的 是 , 绝对 值 函数 是 不 可 微 
的 , 所 以 微 积分 工具 不 可 用 . 

本 节 最 后 会 详细 地 阐述 对 误差 平方 的 选择 . 这 体现 了 该 主题 中 最 大 的 挑战 之 
一 : 考察 正确 的 统计 量 . 我 们 可 以 研究 任何 想 要 的 量 , 但 问题 在 于 , 这 个 量 什么 时 
候 有 效 并 且 能 发 挥 作 月 


闻 | 


LU 
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注 24.2.1 (如 何 测量 误差 的 选择 ) ” 当 测 量 理论 值 与 观测 值 之 间 的 误差 时 , 我 
们 有 三 种 自然 选择 : 


Bi(a,b) = > (yn — (axn + 0)), (24.2) 

Be 
Ea(a,b) = > | 加 一 (azn 十 中 (24.3) 

和 本 
Es(a,b) = 2 ln — (azn + 0)). (24.4) 


式 (24.2) 的 问题 是 , 这 些 误差 是 有 符号 的 , 并 且 正 误差 可 以 与 负 误差 相互 抵消 . 式 
(24.3) 的 问题 是 ， 绝对 值 函 数 是 不 可 微 的 ,因此 微 积 分 工具 及 结果 都 不 可 用 . 式 
(24.4) 的 问题 是 , 误差 的 权重 不 等 : 大 误差 的 权重 要 比 小 误差 大 得 多 . 因此 , 这 三 种 
方法 都 存在 问题 . 尽管 如 此 , 与 优点 相 比 , 式 (24.4) 的 问题 并 没有 那么 糟糕, 其 优点 
是 误差 不 会 相互 抵消 , 并 且 微 积分 工具 是 可 用 的 . 因此 , 大 多 数 人 通常 使 用 式 (24.4) 
并 利用 平方 和 来 测量 误差 . 


24.3 ”最 小 二 乘法 


我 如 此 喜欢 最 小 二 乘法 的 原因 之 一 是 , 它 能 根据 可 观测 结果 给 出 最 佳 拟 合 参 
数 的 一 个 显 式 闭 型 解 . 之 所 以 可 以 做 到 这 一 点 , 是 因为 我 们 有 微 积 分 和 线性 代数 工 
具 一 一 这 些 年 所 付出 的 努力 应 该 得 到 一 些 回 报 ! 

给 定数 据 {(z1, 奶 ),… , (ZN;,YyN)}, 我 们 把 与 y = az + 相关 的 误差 定义 为 


N 
E(a,b) := 》 (yn — (arn + Db)). (24.5) 


n=1 
注意 , 这 个 误差 是 以 未 知 参数 a 和 5b 为 变量 的 函数 . 
现在 的 目标 是 找到 使 误差 最 小 化 的 a 和 值 . 在 多 元 微 积分 中 , 这 要 求 我 们 求 
出 (a,5) 的 值 , 从 而 使 得 关于 变量 ( 即 a 和 6) 的 梯度 为 0. 因此 , 我 们 需要 


se ( 人 


Oa 50 
或 者 0 
Bo ” 哆 


注意 , 我 们 不 必 担 心 边界 点 : 当 |a| 和 |6| 变 得 较 大 时 , 拟 合 显然 会 越 来 越 差 . 因此 ， 
我 们 不 需要 验证 边界 . 
微分 B(a,b) 可 得 


626 第 24 章 最 小 二 乘法 


N 

= 和 2 (rn t+) (en) 
N 

2 D2 (arnt) (1), 


令 9E/6a = 0E/6b = 0 (并 除 以 -2), 则 有 


N 
》 (yn — (azn +b)): zn =0 


六 二 法 


N 
>» (yn (azZn te b)) = 0. 


入 过 站 


Eo ee -2 是 因为 -2 是 一 个 常数 . 我 们 不 能 除 以 zx;,， 


这 些 等 式 可 以 改写 成 
N N N 
ee ee 
EE) 
各 二 二 二 总 三 并 
因此 , 使 误差 (定义 参见 式 (24.5)) 最 小 化 的 a 和 5 值 会 满足 下 列 和 矩阵 方程 : 
N N N 
2 Tn > mr 2 Tnyn 
入 = 让 雹 二 下 人 也 w= (24 6) 
N N b N 3S 
2 21 2 
机 二 1 和 三 击 天 二 十 


我 们 需要 利用 线性 代数 中 的 一 个 事实 ， 回 忆 一 下 , 矩阵 4 的 逆 和 矩阵 是 使 得 
AB = BA = 了 的 矩阵 B, 其 中 了 工 是 单位 矩阵 . 如 果 4 = SS 


yy 6 
的 矩阵 , 并 且 det A 二 a6 -By 六 0, 那么 A 是 可 道 的 并 
Ee 1 0 2 ) 
人 a0 一 DT 可 Q 
换 句 话说 此 时 有 44-1 = 1 例如 , 如 果 A 二 3 a 


47! 一 (了) 对 于 这 一 点 我 们 可 以 用 下 面 的 式 子 来 验证 (利用 笨 阵 乘法 ) 


是 一 个 2x2 
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1 2\/7 -2 /1 0 
G - a 上 0 让 
我 们 可 以 证 明 式 (24.6) 的 矩阵 是 可 逆 的 (只 要 至 少 有 两 个 x,, 不 同 )， 这 表 
明了 


N N -lyN 
Dm Dn| | 2 rn 
a = E 
(0 二 吉本 人 人 . (24.7) 
>_zn 21 2 yn 
nn 二 Tol 扳 王 由 
因此 , 现在 只 需要 证 明 可 逆 性 . 用 AM 表示 式 (24.6) 中 的 矩阵 .AM 的 行列 式 等 
于 N N N N 
det AM = >》 2 人 pn py 
为 二 二 入 三 站 扳 三 由 六 二 路 
因为 ee 
TT 二 一 Wns 
V2 
所 以 
N 
det M =N) rx? — (NE)? 
多 = 


最 后 一 个 等 式 是 通过 简单 的 代数 运算 得 到 的 . 于 是 ， 只 要 所 有 的 z， 都 不 相等 ， 
det M 就 是 非 0 的 , 那么 M 就 是 可 逆 的 . 由 方差 的 定义 可 知 , 上 式 也 能 写成 


Bt 


det MT = N?o2. 


因此 , 我 们 发 现 只 要 x 不 全 相等 , a 和 b 的 最 佳 拟 合 值 就 可 以 通过 求解 一 个 
线性 方程 组 得 到 . 这 个 解 由 式 (24.7) 给 出 . 
我 们 把 式 (24.7) 改写 成 更 简单 的 形式 . 利用 矩阵 的 道 以 及 均值 和 方差 的 定义 ， 


我 们 有 六 
N —NT DY znyn 
(0 和 sb (24.8) 
b N202 [| —Nz 2 
2 六 
我 三 出 


汽 二 二 


展开 上 式 可 得 
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N 
N 》 rnyn 一 NT yn 
n=1 n= 


也 一 


N20% 
N N N 
-NZ》， znyn 二 >》 2 SD: Yn 
De 1 疗 寺 水 二 
N20% 


1 
o2 = NR — ZT)2. (24.9) 
因为 a 和 的 公式 非常 重要 , 所 以 有 必要 给 出 关于 它们 的 另 一 个 表达 . 我 们 
还 有 
NM N N N 
二 三 Ri 一 的 三 二 n=1 先 三 1 
N N N N 
DDDE DPDE DIE 
A a es 
b = 2 (24.10) 
>》 on》 rn D1 
T= n=1 和 | 


注 24.3.1 上 面 关于 a 和 的 公式 是 合理 的 , 这 一 点 可 以 从 单位 分 析 中 看 出 . 
例如 , 假设 x 的 单位 是 米 , 而 vy 的 单位 是 秒 . 如 果 y 二 ax 十 b, 那么 5 和 % 就 要 有 相 
同 的 单位 ( 秒 ), 而 a 的 单位 则 是 秒 每 米 . 当 把 式 (24.9) 右 端的 各 量 都 代入 单位 时 ， 
我 们 会 看 到 a 和 0b 的 单位 是 正确 的 . 虽然 这 并 不 能 证 明 我 们 没有 犯错 , 但 会 让 我 们 
感到 更 安心 . 不 管 研究 什么 , 你 都 应 该 尝试 像 这 样 的 单位 计算 . 

a 和 5 还 有 其 他 等 价 公 式 , 这 些 公式 给 出 了 相同 的 答案 , 但 代数 运算 的 次 序 却 
略 有 不 同 . 从 本 质 上 看 , 我 们 正在 做 下 列 事情 : 假设 已 知 

4 二 3a 十 20 


5 一 2a 十 50. 


解决 这 个 问题 的 方法 有 两 种 .第 一 ,可 以 利用 第 一 个 等 式 , 把 ! 用 a 来 表示 , 然后 
将 结果 代入 第 二 个 等 式 . 第 二 , 也 可 以 把 第 一 个 等 式 的 两 端 同时 乘 上 5, 把 第 二 个 
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等 式 的 两 端 同时 乘 上 2, 然后 让 两 个 式 子 相 减 . 这 样 与 相关 的 项 就 消 掉 了 , 从 而 
可 以 求 出 a 的 值 . 具体 地 说 ， 


20 = 15a 十 100 
10 = 4a 十 101， 
由 此 可 得 
10 = 11a, 
或 者 
a = 10/11. 


注 24.3.2 图 24-1 中 的 数据 是 这 样 得 到 的 : 设 zn = 5 十 0.2n, 并 设 y= 5zn 
再 加 上 一 个 误差 项 , 这 个 误差 是 从 均值 为 0 且 标 准 差 为 4 的 正 态 分 布 中 随机 选 出 
来 的 (ne {1,.… ,100}). 利用 这 些 值 , 我 们 找到 了 一 条 最 佳 拟 合 线 


y = 4.997¢ + 0.48. 


因此 a 二 4.99 且 5 二 0.48. 由 于 我 们 期 望 的 关系 式 为 y 二 5z, 所 以 a 和 5b 的 最 佳 拟 
合 值 分 别 是 5 和 0. 

虽然 a 的 值 很 接近 真实 值 , 但 已 的 值 却 存在 非常 明显 的 偏差 . 我 们 故意 选择 具 
有 这 种 特点 的 数据 是 为 了 说 明 使 用 最 小 二 来 法 的 危险 . 我 们 知道 4.99 是 斜率 的 最 
佳 值 , 0.48 是 y 截 距 的 最 佳 值 , 但 这 些 并 不 能 说 明 它 们 是 对 真实 值 的 良好 估计 . 这 
个 理论 需要 补充 一 些 提供 误差 估计 的 技术 . 因此 , 我 们 想 知 道 这 样 一 些 事 情 , 比如 
利用 给 定 的 数据 , a 的 真实 值 属 于 (4.96,5.02) 且 5 的 真实 值 属 于 (一 0.22,1.18) 的 概 
率 为 99%. 这 比 只 知道 最 佳 拟 合 值 要 有 用 得 多 . 

如 果 我 们 使 用 

Eaps(a, b) = Dh (axn + 5)|, 


那么 由 数值 计算 方法 可 得 , a 的 最 佳 拟 合 值 为 5.03, 的 最 佳 拟 合 值 的 绝对 值 小 于 
10-10. 这 种 方法 与 最 小 二 乘法 的 区 别 在 于 (两 个 参数 中 最 不 重要 的 )b 的 最 佳 拟 合 
值 , 这 种 区 别 来 源 于 加 权 误 差 的 不 同方 法 . 


24.4 习 题 


习题 24.4.1 ”考虑 观察 到 的 数据 (0,0)、(1, 1) 和 (2, 2). 应 该 清楚 的 是 , 最 佳 拟 合 线 是 y = z. 
这 使 得 测量 误差 的 三 种 方式 , 即 式 (24.2)、 式 (24.3) 以 及 式 (24.4) 的 误差 均 为 0. 然而 ， 
你 要 证 明 : 当 使 用 式 (24.2) 来 测量 误差 时 , 直线 y = 1 的 误差 也 是 0, 显然 这 不 应 该 是 最 
好 的 拟 合 线 ! 
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习题 24.4.2 ”推广 最 小 二 乘法 找到 y = az2 + bx 十 c 的 最 佳 拟 合 二 次 方程 (或 更 一 般 地 , 找 


习题 


习题 


到 y = amz7m 十 am-_17” 1 十.… 十 ao 的 最 佳 拟 合 m 次 多 项 式 ). 


对 了 


任何 实际 问题 , 直接 计算 就 可 以 确定 最 终 的 矩阵 是 否 可 逆 , 但 能 够 证 明 这 个 行 


式 对 于 最 佳 拟 合 线 总 是 不 为 0 会 非常 不 错 (如 果 所 有 的 z 都 不 相等 ). 
如 果 z 不 全 相等 , 那么 对 于 最 佳 拟 合 二 次 方程 式 还 是 最 佳 拟 合 三 次 方程， 


24.4.3 


式 必须 是 非 0 的 ? 


ht 


行 


列 


列 


看 看 最 小 二 乘法 的 证 明 , 我 们 注意 到 y = az 十 并 不 是 必 不 可 少 的 . 可 以 令 y = 


QJZ) 十 


最 后 ， 我 们 简单 地 阐述 一 个 非常 重要 的 变量 替换 它 可 以 让 我 们 在 更 多 情况 下 使 / 
FE 试图 证 明和 牛顿 的 万 有 引力 定律 . 该 定律 称 , 对 于 
的 物体 , 它们 之 间 的 引力 大 小 是 Gmim2/r?, 其 中 > 是 物体 之 


小 二 乘法 . 考虑 一 个 例子 , 研究 人 员 1 
个 质量 分 别 为 mi 和 mm 


bg(z)， 并 
Se Jonglan) 
> f(zn)g(zn) > g(zn)? 


四 > g(rn)yn 


论述 也 是 类 似 的 . 不 同 之 处 在 于 , 现在 能 够 得 到 


>， jcn)yn 


如 三 工 


(24.11) 


DL 


间 的 距离 . 如 果 物 体 的 质量 是 固定 的 , 那么 3 


五 二 Ek/r”, 其 中 n= 2 (k 的 值 取决 于 
憾 的 是 , 正如 所 写 的 那样 , 我 们 不 能 使 
( 它 是 距离 的 指数 ). 

我 们 可 以 通过 对 数据 i 


及 = logr, 那么 关系 式 == 有/r” 就 变 成 了 三 = nR 十 KK. 现在 就 可 以 利 ) 


1 取 


力 的 大 小 与 距离 成 反比 . 这 种 关系 可 以 写成 


G 和 质量 的 乘积 ). 显然 , n 是 更 重要 的 参数 . 


I 


了 . 与 初始 问题 的 唯 
体 之 间 的 距离 , 而 是 距离 的 对 数 . 沿 着 这 种 


Ee 


区 别 在 于 


j 最 小 二 乘法 ， 


我 们 如 何 收集 和 处 理 


因为 其 中 一 个 未 知 参数 是 非 线性 


j 最 小 二 乘 
现在 , 我 们 的 数据 不 是 两 个 


使 用 最 4 


` 二 乘法 的 例子 . 因此 , 我 们 (终于 ) 实现 了 许多 高 中 数学 老师 多 年 前 的 承诺 : 


数 是 有 


的 ! 


24.4.4 ”考虑 式 (24.11) 给 出 的 最 小 二 乘法 的 推广 . 矩阵 在 什么 条 件 下 是 可 逆 的 ? 
知 24.4.5 


些 函 数 不 一 定 是 线 怕 


然后 , 利 
数 (a1,: 


24.4.6 


这 种 证 明 方法 可 以 进 


J 上 出 
1 


… ,Qk) 必须 满足 的 矩阵 方程 . 
当 考 察 利 用 


点 (F, 胡 是 否 在 最 佳 拟 合 线 上 , 其 中 五 二 1 


拟 合 线 是 否 穿 过 “平均 信 
24.4.7( 


》” 占 9 
人 


EE 的, 我 们 只 需要 有 一 个 函数 


作 广 到 当 y 是 K 个 给 定 函 数 的 线性 组 合 的 情况 . 
的 线性 组 合 , 即 ai 万 (z) 十 十 agj(z). 
用 微 积 分 与 线性 代数 , 找 出 能 最 小 化 误差 平方 和 的 a1,… ,axk. 求 出 最 佳 拟 合 


开 普 勒 第 三 定律 ) 开 普 勒 第 三 定律 指出 , 如 果 了 是 行星 在 椭圆 轨道 上 绕 太 阳 


行 的 轨道 周 
得 这 是 三 条 定律 中 最 难 的 , 怎样 才能 从 观测 数据 了 


期 (没有 其 他 物体 存在 ), 那么 


最 小 二 乘法 . 
成 了 aT = bL 十 c, 这 样 就 可 以 利 


令 了 = 


logT、£L 


遗 


的 


行 对 数 变换 来 解决 这 个 问题 . 令 K = logk, 太 = logF 且 


法 
物 


思路 进行 论证 , 许多 窜 关 系 都 可 以 转换 为 能 够 


对 


这 


系 


最 小 二 乘法 得 到 的 最 佳 拟 合 线 时 , 最 佳 拟 合 值 则 由 式 (24.7) 给 出 . 
zn 且 = 并 加? 换 句 话说 , 最 


佳 


运 


7T? = C7 其 中 工 为 半 长 轴 的 长 度 . 我 总 觉 


二 log 工 且 ec = logC. 于 是 , 关系 式 Te = CL* 就 
最 小 二 乘法 了 . 8 颗 行 星 (遗憾 的 是 , 冥王 星 不 再 


P 得 出 正确 的 指数 值 呢 ? 一 种 方法 是 


九 
利 
变 
被 


24.4 习 题 631 


认为 是 行星 了 ) 的 半 长 轴 分 别 是 : 水 星 0.387, 金星 0.723, 地 球 1.000, 火星 1.524, 木星 


5.203, 土星 9.539, 天 王 星 19.182, 海王 星 30.06 (这 里 的 单位 是 天 文 单位 , 一 个 天 文 单位 


是 1.496.108 干 米 ). 它们 的 轨道 周期 


pe 


年 ) 分 别 为 0.240 846 7, 0.615 197 26, 1.000 017 4， 


1.880 847 6, 11.862 615, 29.447 498, 84.016 846 和 164.791 32. 根据 这 些 数据 , 利用 最 小 


二 乘法 , 在 7T* = CZ? 中 找 出 a 和 的 最 佳 拟 合 值 . 
实际 上 , 如 上 所 述 , 这 个 问题 有 点 不 确定 ， 原 因 丸 


Re 


注意 , 你 当然 需要 使 
I 下. 假设 我 人 有 72 = 5 三 7” = 


jaT =bL+4C.) 


25L6 或 了 = V5L'5, 甚至 是 了 = 625L*， 所 有 这 些 都 是 相同 的 等 式 ! 换 句 话说 , 为 


了 简单 起 见 , 不 妨 设 a = 1. 这 种 做 法 具有 一 般 性 . 


题 的 角度 是 如 何 对 我 们 产生 帮助 的 . 乍 一 看 , 这 道 


这 个 例子 再 一 次 说 明了 改变 考察 问 


习题 涉及 三 个 未 知 参数 , 即 a, b 和 C， 


情形 . 


为 了 方便 起 见 , 这 里 给 出 了 数据 的 自然 对 数 : 半 长 轴 的 长 度 依次 为 


{ 一 0.949 331, —0.324 346, 0, 0.421 338, 1.649 24, 2.255 39，2.953 97,，3.4032}, 


周期 (年 ) 的 自然 对 数 依次 为 


但 是 令 a = 1 不 会 对 一 般 性 造成 任何 影响 . 因此 , 为 了 更 加 简便 , 我 们 只 考虑 这 种 特殊 


{— 1.423 59, —0.485 812, 0.000 017 399 8, 0.631 723, 2.473 39, 3.382 61, 


4.431 02, 5.104 68}. 


本 题 要 求 你 找到 a 和 ”的 最 佳 拟 合 值 . 从 某 种 意义 上 来 说 , 这 有 些 误导 性 , 因为 (8 
存在 无 限 多 种 可 能 值 . 但 是 , 它们 所 有 的 取 值 都 有 一 个 相同 


应 该 接近 于 3/2 或 1.50). 这 个 比值 才 是 最 重要 的 


的 比值 wa ( 开 善 勒 说 这 个 从 
普 勒 第 三 定律 的 内 容 是 , 周期 的 3 


方 与 半 长 轴 的 立方 成 正比 . 关键 数字 是 周期 的 究 和 长 度 的 窜 ( 即 a 和 2。 


— 


I 


Rl 


, 而 不 是 比例 常 


数 . 这 就 是 为 什么 只 要 求 你 找到 a 和 的 最 佳 拟 合 值 , 而 不 是 C (或 C), 因为 C (或 C) 


没有 那么 重要 . 如 果 令 a = 1, 那么 C 的 最 佳 拟 合 值 训 


TI 


可 约 为 1.50. 


it 是 0.000 148 796, 而 5。 的 最 佳 拟 合 


为 了 找到 a 和 "满足 关系 式 y = az 十 b 的 最 佳 拟 合 值 , 上面 给 出 了 很 多 不 同 的 公式 . 


对 我 们 来 说 , 现在 有 工 = 2L 十 $4. 因此, 在 本 题 


a 


的 角色 由 < 来 扮演 . 那么 , 如 果 想 求 出 本 题 中 比值 
中 两 个 公式 里 的 第 一 个 . 


PF, 上 述 a 的 角色 


2 的 最 佳 拟 合 值 , 就 


b 
a 


来 扮演 , 上 述 5 


证 


更 利用 式 (24.10) 


第 25 章 两 个 著名 问题 与 一 些 代 码 


几乎 所 有 的 课程 都 会 涉及 一 些 著名 的 概率 问题 , 其 中 之 一 就 是 婚姻 (或 秘书 ) 


问题 . 


婚姻 (或 秘书 ) 问题 : 已 知 某 项 工作 有 n 名 申请 人 , 每 次 面试 一 人 . 对 于 每 一 位 
应 聘 者 , 一 旦 我 们 决定 不 聘请 他 , 这 个 人 就 永远 失去 了 机 会 . 采用 什么 样 的 策略 ， 
才能 使 选 到 最 佳人 选 的 概率 最 大 化 ? 

换 名 话说 , 每 次 面试 申请 人 时 , 我 们 都 要 立即 决定 是 否 给 他 提供 这 份 工作 . 如 
果 决 定 不 聘用 他 , 那么 他 就 会 被 其 他 公司 抢 走 , 不 会 再 回来 . 显然 , 这 个 问题 可 以 修 
改 成 约会 问题 或 婚姻 问题 , 所 以 它 也 有 其 他 的 名 字 . 另外 , 我 们 还 会 考察 著名 的 蒙 
提 霍 尔 问 题 . 它 与 婚姻 /秘书 问题 不 同 , 但 也 涉及 寻找 最 佳 解决 方案 的 一 系列 选择 ， 
所 以 把 它 列 入 同一 章 应 该 是 很 自然 的 . 

还 有 更 多 有 趣 的 问题 , 比如 信封 问题 和 萍 丰 投 针 问题 . 遗憾 的 是 , 本 书 篇 幅 已 
经 很 长 了 , 所 以 我 鼓励 你 自行 查阅 这 两 个 问题 . 


~ 


25.1 婚姻 /秘书 问题 


25.1.1 ”假设 与 策略 
每 当 分 析 一 个 难题 时 , 你 最 好 先 仔 细 地 列举 出 已 知 条 件 , 并 确保 没有 隐 式 地 假 
设 任何 东西 . 关于 这 一 点 , 我 们 来 具体 看 看 秘书 问题 . (我 们 的 讨论 必须 要 公式 化 , 所 
以 为 了 明确 起 见 , 现在 来 考察 秘书 问题 . 我 担心 你 会 因为 把 这 些 知识 应 用 到 实际 生 
活 中 , 但 问题 却 没 有 得 到 解决 而 向 我 投诉 .) 
下 面 是 最 常见 的 一 种 分 析 里 的 假设 . 如 果 你 喜欢 这 个 问题 , 我 鼓励 你 做 出 自己 
的 修改 (但 这 只 是 一 种 学 术 练 习 不 过 , 几 年 前 我 的 一 个 学 生 说 , 他 会 根据 下 面 所 学 
的 知识 来 选择 妻子 ; 他 现在 仍 是 单身 ). 
。 第 一 , 对 于 每 个 申请 人 , 我 们 必须 当场 决定 聘用 或 不 聘用 他 .如果 选择 不 聘 
他 , 那么 以 后 都 不 能 聘用 这 个 人 . 
。 第 二 , 我 们 可 以 确定 每 个 申请 人 的 相对 排名 . 这 意味 着 我 们 可 以 给 每 个 人 打 
分 , 并 将 他 们 的 分 数 与 之 前 的 申请 者 进行 比较 . 假设 我 们 知道 一 共有 多 少 名 
候选 人 ; 如 果 不 知道 , 这 个 问题 就 更 难 了 . 注意 , 对 于 分 数 的 分 布 , 我 们 没有 


25.1 婚姻 /秘书 问题 ”633 


现在 来 看 看 我 们 的 策略 应 该 是 什么 ， 
为 解决 这 个 问题 毫 无 希望 . 申请 人 是 按照 


给 出 任何 相关 假设 . (例如 , 若 分 数 服 从 关于 n 个 人 的 离散 均匀 分 布 , 那么 如 


设 分 数 之 间 没 有 关系 . 


第 三 , 求职 者 随机 、 独 立地 面试 ， 


果 某 人 排 在 第 ”位 , 我 们 就 知道 这 个 人 是 最 佳 选择 .) 为 了 简单 起 见 , 我 们 假 


并 且 所 有 申请 人 都 等 可 能 地 在 任何 位 置 面 


试 . 另 一 种 说 法 是 , 对 于 ml 种 可 能 的 面试 次 序 , 每 一 种 次 序 出 现 的 概率 都 是 


相等 的 . 


第 四 , 只 要 没有 聘用 最 优秀 的 1 
请 人 与 聘用 最 差 的 申请 人 没有 


王 何 区 别 . 这 是 一 种 


实 世 界 存在 着 强烈 的 偏差 . 在 现实 世界 


请 者 , 就 视 为 彻底 失败 : 聘用 第 二 优秀 的 申 
FE 常 苛刻 的 条 件 , 它 与 现 


刻 没有 优秀 者 的 概率 变 


得 非常 大 时 , 就 会 导致 一 种 “解决 ” 它 的 倾向 , 我 们 的 假设 不 是 对 现实 世界 
的 一 个 很 好 的 近似 , 但 是 它 极 大 地 简化 了 数学 , 并 且 是 一 个 很 好 的 第 一 模型 


日 


第 五 , 如 果 你 聘用 申请 人 , 那么 申请 人 会 自动 接受 这 


人 都 不 想 和 你 在 一 起 吗 ? 


略 , 或 者 更 一 般 地 说 , 我 们 始终 选择 第 
n 较 大 时 ,如 果 采 月 


意 , 当 
/EN\) 


请 人 . 我 们 要 给 出 更 好 的 策略 ! 
下 面 的 策略 会 做 得 非常 好 . 我 们 选择 某 个 与 n 相关 的 数字 k, 然后 逐个 考察 前 


k 个 申请 人 . 我 们 不 会 聘 上 
接 下 来 ， 
这 一 策略 不 仅 比 我 们 天 真 地 尝试 做 得 更 好 , 而 且 
最 优秀 申请 人 的 概率 会 超过 30%! 


] 其 中 任 合 


份 工作 . 毕竟 , 难道 每 个 


并 分 析 它 有 多 成 功 . 最 初 , 人 们 很 容易 认 
随机 次 序 参 加 面试 的 .我 们 可 能 会 选择 


第 一 个 申请 人 , 因为 他 可 能 是 最 优秀 者 的 概率 与 其 他 人 相同 . 如 果 我 们 使 用 这 个 策 
i 个 申请 人 , 那么 成 功 的 概率 就 是 1/n. 注 
这 个 策略 , 那么 我 们 基本 上 没有 机 会 聘用 到 最 优秀 的 申 


过 他 们 来 了 解 申请 人 的 整体 情况 . 
我 们 会 选择 下 一 个 分 数 比 我 们 见 过 的 最 高 分 还 要 高 的 人 , 并 决定 聘用 他 . 
| 当 nn 趋向 于 无 穷 大 时 , 我 们 聘用 到 


在 分 析 这 一 策略 之 前 , 有 必要 解释 一 下 为 什么 选择 这 种 方法 而 不 是 其 他 方法 . 


例如 , 为 什么 我 们 的 策略 不 是 选择 第 一 个 分 数 是 所 见 过 
的 人 , 或 者 第 一 个 比 见 过 的 
的 分 布 . 实际 上 , 最 好 不 要 考虑 整体 


最 高 分 多 3 分 的 人 ? 原 医 


高 分 2 倍 (或 其 他 倍数 ) 
] 不 知道 分 数 服从 什么 样 
想象 我 们 只 知道 人 们 的 相对 排名 . 因 


此 , 我 们 的 策略 应 该 只 涉及 对 候选 人 的 相对 比较 , 而 不 是 整体 的 比较 . 
25.1.2 ”成 功 的 概率 


和 


二 


用 这 种 策略 , 取得 成 功 的 概率 


Prob( 成 功 ) = >》 Prob( 成 功 | 第 m 个 是 最 优秀 的 ) Prob( 第 m 个 是 最 优秀 的 ). 


这 个 式 子 是 利 


Tl 


划分 得 到 的 : 最 优秀 的 申请 人 一 定 在 某 个 位 置 上 , 而 且 只 能 在 一 个 
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C. 世 
有 些 计算 很 简 


FE 定 要 


上 , 那么 我 们 注 


位 置 


概率 就 等 于 0. 


作 点 在 于 , 当 已 知 最 优秀 者 所 在 的 不 同位 置 时 , 求 H 
和 .如 果 最 优秀 的 申请 人 4H 
失败 . 这 大 糟糕 了 , 我 们 不 仅 没 
一 个 人 没有 招 到 ! (但 我 们 可 以 调整 策略 , 说 如 果 我 
后 一 个 申请 人 . ) 好 了 , 也 就 是 说 , 当 最 优秀 的 申请 人 上 


成 功 的 概率 . 

上 现在 前 天 个 位 置 中 的 任何 一 个 位 置 
能 招 到 最 优秀 的 人 , 而 且 最 终 也 
门 一 直 没 有 招 到 人 , 那 就 聘用 最 
8 现在 前 天 个 人 中 时 , 成 功 的 


现在 继续 往 下 考虑 . 我 们 可 以 假定 最 优秀 的 申请 人 出 现在 后 n 一 k 个 人 中 . 为 
更 加 上 有 具体, 不 妨 设 他 出 现在 第 m 十 1 个 位 置 上 , 其 中 < mm <n 一 1 ( 设 最 优秀 的 
人 出 现在 第 mm 十 1 个 位 置 上 , 而 不 是 第 m 个 位 置 上 , 这 可 以 让 代数 运算 更 加 简便 . 
我 们 之 前 曾 处 理 过 这 种 计算 , 其 好 处 现在 就 体现 出 来 了 . 当然 , 你 也 可 以 假设 最 优 
秀 的 人 位 于 第 m 个 位 置 上 ). 于 是 , 上 述 概率 就 可 以 改写 成 
nl 
Prob( 成 功 ) = 》 Prob( 成 功 | 第 m 十 1 个 是 最 优秀 的 ) 
Wi 
Prob( 第 m 十 1 个 是 最 优秀 的 ). 


当 已 知 最 优秀 的 申请 人 位 于 第 m 填 1 个 位 置 上 时 , 我 们 成 功 的 概率 是 多 少 ? 这 


是 一 个 条 件 概率 , 它 等 于 k/m. 这 是 分 析 中 最 难 的 部 分 , 我 们 仔细 地 讨论 一 下 ， 从 
总 体 上 看 , 最 优秀 的 是 第 m+1 个 人 , 那么 前 m+1 个 人 


下 .生生 


征 囊 叹 十 1 


最 优秀 的 仍然 


个 . 现在 问题 就 归结 为 , 在 前 到 十 1 个 人 中 , 第 二 优秀 的 人 所 在 的 位 置 . 或 者 说 , 既 


然 最 优秀 的 是 第 m 

如 果 他 日 
如 果 前 m 十 1 个 人 中 第 三 优秀 的 人 出 
个 、 第 大 十 2 个 


现在 前 
第 m 个 人 优秀 . 


因 电 


十 1 个 人 , 那么 前 m 个 人 中 最 优秀 的 人 位 于 第 几 个 位 置 上 . 
现在 前 个 人 中 , 那么 我 们 就 能 选中 第 m+ 1 个 申请 人 . 为 什么 呢 ? 


条 天 个 位 置 上 , 那么 这 个 人 就 比 第 十 1 


b, 我 们 过 到 的 第 一 个 比 他 更 优秀 的 人 是 


第 m 十 1 个 人 , 于 是 我 们 选中 这 个 人 六 


获得 


成 功 . 反之 , 如 果 前 m 个 人 中 最 优秀 者 


没有 出 现在 前 个 人 中 , 那么 我 们 就 会 失败 . 为 什么 ? 现在 , 我 们 看 一 看 前 天 个 人 ， 
并 选 出 比 他 们 更 优秀 的 第 一 个 人 . 遗憾 的 是 , 我 们 不 可 能 遇 到 第 mm 十 1 个 人 , 因为 
会 更 早 遇 到 前 m 十 1 个 人 中 第 二 优秀 的 人 . 你 应 该 画 一 张 图 . 

那么 , 前 m 个 人 中 最 优秀 的 人 出 现在 前 个 位 置 上 的 概率 是 多 少 ? 由 于 每 个 
人 都 等 可 能 地 出 现在 任何 位 置 上 , 所 以 这 个 概率 就 是 k/m (这 个 人 一 共有 m 种 可 
能 的 选择 , 其 中 , 他 位 于 前 & 个 位 置 上 的 选择 有 种 ). 因此 , Prob (成 功 | 第 m 填 1 


个 是 最 优秀 的 ) = k/m. 


最 优秀 的 1 


请 人 位 于 第 m 个 位 置 上 的 概率 是 多 少 ? 这 个 概率 就 是 1/m， 


申请 人 会 等 可 能 地 出 现在 n 个 位 置 


因为 
FP 的 任何 一 个 上 . 这 意味 着 我 们 成 功 


是 


的 总 概率 
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、 A a 
BA) 2 ee 
m=k m=k 
这 是 一 个 很 好 的 开端 . 现在 我 们 得 到 了 成 功 概率 的 表达 式 . 当 n 和 固定 时 , 我 们 


可 以 求 出 其 体 的 概率 值 , 然后 通过 变动 找到 使 这 个 和 取 到 最 大 值 的 大 
现在 试 着 找到 这 个 和 的 近似 表达 式 . 不 妨 设 ”和 大 都 很 大 , 这 样 就 可 以 利用 
微 积分 的 结果 来 优化 概率 . 对 于 


ko 1 
Pr( 成 功 ) = 人 
利用 添加 0 的 技巧 ， 人 写成 两 个 调和 级 数 的 差 , 即 "二 二 与 二 的 
差 . 你 在 微 积分 课 上 学 过 , 当 ! 较 大 时 , 总 _1 + 会 近似 于 log(1). 事实 证 明 , 这 是 一 
个 很 好 的 近似 : | 
>》 AS log(1) 十 Y 十 误差,， (25.1) 
wir 
其 中 , 7 是 欧 拉 常 数 ( 约 等 于 0.5772). el ~ 1/21, 随 着 1 的 增加 , er 会 迅速 趋向 于 0 
(参见 习题 25.4.1). 于 是 有 
玉 n—l1 1 n—1l 1 k—1 1 天 一 1 1 
Pr( 成 功 ) = ( | ) 
2 名 二 人 jm 
天 n—1l 1 k—1 1 
ss 
~ > (log( — 1)— log(k— 1)) 
~ 7 (log(n) — log(h) 
k Nn 
= 
对 于 给 定 的 k 和 mw, 我 们 得 到 了 成 功 概率 的 解析 表达 式 , 现在 只 需要 求 出 它 的 


最 大 值 . 注意 , 这 里 的 近似 结果 只 与 比值 k/n 有 关 , 表明 我 们 应 该 用 一 个 新 的 变量 


来 替换 k/n, 并 试 着 让 最 终 的 表达 式 取 至 


到 最 大 值 . 


由 于 我 们 想 求 出 最 大 值 , 并 且 这 


这 


个 概率 是 关于 xz = n/k 的 可 微 函 数 , 会 
令 z=m/i 则 有 Pr( 成 功 ) = log(z)/z. 
不 是 近似 结果 . 把 问题 转化 为 求 log(z)/z 的 最 大 值 
很 大 时 , 这 个 结果 应 该 非常 接近 于 真实 值 . 

于 是 , 问题 被 简化 成 了 最 大 化 log(z)/z， ~ 1 <<n (由 此 可 得 nx > 1). 
在 微 积 分 中 学 到 , 为 了 找到 可 能 的 极 值 , 必须 验证 端点 和 临界 点 ( 记 住 , 临界 点 


用 到 微 积 分 也 就 不 奇怪 了 . 
为 了 对 答案 有 一 定 的 了 解 , 我 们 假设 这 
可 以 极 大 地 简化 代数 运算 . 当 n 


你 会 
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是 一 阶 导 等 于 0 的 点 ). 端点 很 容易 验证 , 因为 x = n 和 x = 1 时 的 概率 都 很 小 . 
(z = 在 技术 上 给 出 了 1log(n)/n 的 估计 值 , 它 相 对 于 总 是 从 固定 位 置 选取 申请 
的 概率 1/n 是 “大 的 ”. 但 要 记 住 , 在 近似 时 , 我 们 假设 ”和 大 都 很 大 , 因此 这 里 的 
概率 会 被 临界 点 处 的 概率 超越 . 对 于 这 一 点 , 我 们 不 应 该 感到 惊讶 . ) 

那么 临界 点 呢 , 也 就 是 导数 为 0 的 点 ? 对 于 这 些 点 , 必须 计算 


d (2 _ Tz — log(e) 


dz L 2 

当 分 子 为 0 时 , 上 式 就 等 于 0. 于 是 , 1 - log(z) = 0, 即 > = 。 这 是 一 个 全 局 最 大 
值 , 而 不 只 是 局 部 最 大 值 . 当 z < e 时 , 导数 为 正 ; 当 z =。 时 , 导数 为 0; 当 x>e 
时 , 导数 为 负 . 因此 , 函数 会 一 直 增 加 到 x = e, 并 从 这 个 点 开始 递减 , 所 以 我 们 一 
定 会 在 。 处 取 到 全 局 最 大 值 ( 另 一 种 证 明 请 参阅 习题 25.4.2). 注意 , 将 z = e 代入 
log(z)/z 中 就 可 以 得 到 成 功 的 概率 为 log(e)/e = 1/e, 当 n 较 大 时 , 这 个 值 会 远大 于 
log(n)/n. 

现在 来 解释 一 下 我 们 的 答案 . 因为 z = n/k, 并 且 最 优 的 大 出 现在 ze 时 ( 那 
么 有 Sm/e 或 者 gmn s 1/e), 所 以 最 佳 策略 要 求 我 们 通过 考察 前 1/e 的 人 来 了 解 申 
请 人 的 整体 情况 , 并 聘用 比 这 些 人 都 优秀 的 第 一 位 申请 人 .如 果 采 取 这 种 方法 , 那 
么 聘用 到 最 优秀 申请 人 的 概率 约 为 惊人 的 log(e)/e = 1/e = 36.79%. 我 们 的 新 策略 
不 仅 比 原来 的 概率 1/n 好 很 多 , 而 且 当面 试 人 数 趋向 于 无 穷 大 时 , 它 还 会 给 出 一 个 
正 的 概率 ! 对 我 来 说 , 这 个 结果 绝对 是 惊人 的 , 因为 它 给 出 的 答案 远 远 超过 了 我 们 
最 初 的 预期 . 

虽然 已 经 证 明了 我 们 刚才 讨论 的 策略 给 出 了 最 高 的 成 功 概率 , 但 你 仍然 可 以 
考虑 其 他 一 些 策略 , 从 而 得 到 一 些 直观 的 认识 . 对 这 些 问题 更 全 面 的 讨论 , 请 参阅 
Analysis of Heuristic Solutions to the Best Choice Problem [SSR]. 最 初 的 秘书 问题 
也 产生 了 许多 变 体 , 其 中 包括 最 小 化 候选 人 的 预期 排名 , 当 已 知 候选 人 是 取 自 某 一 
特定 分 布 时 使 候选 人 的 期 望 值 最 大 化 , 选 出 一 个 候选 人 子 集 并 使 得 这 些 候 选 人 比 其 
他 人 都 要 优秀 , 以 及 找到 第 二 优秀 的 候选 人 . 最 后 一 个 问题 由 Robert Vanderbei 解 
决 , 他 将 其 命名 为 博士 后 问题 (Postdoc Problem). 

注 25.1.1 最 后 , 我 们 给 出 一 个 简短 的 警告 . 如 果 你 仔细 地 阅读 了 上 面 的 内 容 ， 
可 能 会 注意 到 一 个 小 误差 . 记 住 , 有 必须 是 一 个 整数 , 但 在 分 析 的 最 后 , 我 们 选择 让 等 
于 n/e, 这 显然 不 是 整数 ! 幸运 的 是 , 这 个 问题 很 容易 修正 ,当天 从 0 增加 到 ne 
时 , 成 功 的 概率 会 不 断 增 加 ; 当天 从 m/e 增加 到 n 时 , 这 个 概率 又 会 不 断 减 小 . 
此 , 最 优 的 天 要 么 是 小 于 n/e 的 最 大 整数 , 要 么 是 大 于 n/e 的 最 小 整数 . 我 们 只 需 
要 检验 这 两 个 值 即 可 . 一 般 来 说 , 从 一 个 全 局 最 优选 择 过 渡 到 一 个 真正 的 最 优选 择 
是 很 困难 的 (见习 题 25.4.18). 因为 这 里 函数 的 变换 很 巧妙 , 所 以 我 们 真 的 非常 幸运 . 
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25.1.3 ”秘书 问题 的 代码 


本 章 的 目标 之 一 是 讨论 编程 , 所 以 本 节 最 后 用 一 个 简单 的 程序 来 检验 我 们 的 理 


论 推 测 . 
secretaryproblem[n_, numdo_] := Module[{}, 
(* num 表示 进行 了 num 次 模拟 *) 
k = Round[1.0 n/E]; (* 取 最 接近 n/e 的 整数 *) 
success = 0; (* 成 功 的 次 数 *) 
people = {J}; (+ 创建 人 员 列 表 *) 
For[j = 1, j <= n, j++, people = AppendTo[people, j]]; 


For [num = 1, num <= numdo, numt++, 
{ 
(* 对 人 员 随 机 排序 *) 
order = RandomSample [people]; 
(* 遍历 列表 ， 看 看 前 k 个 人 中 谁 最 优秀 *) 
(* 继续 进行 下 去 ， 直 到 找到 下 一 个 更 优秀 的 人 ; 
如 果 第 n 个 人 被 聘用 ， 那 么 其 他 人 都 落选 了 *) 


max = 0; 


For[j = 1, j <= k, j++, If[order[[j]] > max, max = order[[j]]]]; 


best = 0; 
For[j =k + 1，j<= n, j++, 
If [order[[j]] > max, 
{ 
best = order[[j]]; 
j= n+ 1000; (* 
退出 j 的 循环 ， 因 为 找到 了 比 前 kK 个 更 优秀 的 人 *) 
站; (* 结束 if 语句 *) 
(* 结束 对 j 的 循环 *) 
If[best == n, success = success + 1]; 


}]; (* 结束 对 num 的 循环 *) 


Print["Theory predicts successful ", SetAccuracy[100. / E, 3],， 


由 
Print ["We were successful ", 100. success / numdo，'!"%Y.1"] ; 
] ; 
在 n== 1000 的 情况 下 , 运行 程序 10 000 次 产生 了 以 下 结果 : 
Theory predicts successful 36.79%. 


We were successful 36.78%. 
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这 是 一 个 非常 好 的 拟 合 ! 你 能 让 程序 更 高 效 吗 ? 注意 , 如 果 你 想 检验 并 确保 这 
个 程序 按照 你 的 要 求 正常 工作 , 那么 上 述 程序 是 做 不 到 的 . 现在 没有 办 法 知道 它 是 
否 得 到 了 正确 答案 . 我 们 可 以 通过 添加 一 些 打 印 语 句 来 解决 这 个 问题 . 我 想 添加 一 
个 打印 变量 : 如 果 赋 值 1, 它 会 打印 出 一 些 中 间 值 ; 如 果 赋 值 0, 它 就 不 会 打印 . 


secretaryproblemdebug[n_, numdo_, print_] := Module[{}, 
(* num 表示 进行 了 num 次 模拟 *) 
k = Round[1.0 n/E]; (* 取 最 接近 n/e 的 整数 *) 
success = 0; (* 成 功 的 次 数 *) 
people = {y; (* 创建 人 员 列 表 *) 
If[print == 1， 
Print["Printing results as go along for debugging. When printing 
the best value a value of 0 means the best overall was in the first 
k.\n"]; 
J 
For[j = 1, j <= n, j++, people = AppendTo[people, j]]; 
For [num = 1, num <= numdo, num++, 
{ 
(* 对 人 员 随 机 排序 *) 
order = RandomSample [people]; 
(* 遍历 列表 ， 看 看 前 k 个 人 中 谁 最 优秀 *) 
(* 继续 进行 下 去 ， 直 到 找到 下 一 个 更 优秀 的 人 ; 
如 果 第 n 个 人 被 聘用 ， 那 么 其 他 人 都 落选 了 *) 
max = 0; 
For[j = 1, j <= k, j++, If[order[[j]] > max, max = order[[j]]]]; 
best = 0; 
For[j =k + 1，j<= n, j++, 
If [order[[j]] > max, 
{ 
best = order[[j]]; 
j= n+ 1000; (x 
退出 j 的 循环 ， 因 为 找到 了 比 前 k 个 更 优秀 的 人 *) 
}]; (* 结束 if 语 句 *) 
] ; (* 结束 对 j 的 循环 *) 


If[best == n, success = success + 1]; 


If[print == 1, 
下 


Print["k = ", k, "; best in first k is ", max, 
"; first better than best in first k is ", best]; 

Print["Sorted list is ", order]; 

If [best == n, Print["Success!\n"], Print["Failure\n"]]; 


}]; (* 结束 print 语 句 *) 


站 ; (* 结束 对 num 的 循环 *) 

Print["Theory predicts successful ", SetAccuracy[100. / E, 3], 
1 . 呵 

Print["We were successful ", 100. success / numdo, "%."]; 


]; 


25.2 ” 蒙 提 霍 尔 问题 


男 一 个 著名 的 谜 题 是 蒙 提 霍 尔 问题 , 这 是 一 种 反 直 觉 的 挑战 , 任何 一 本 没有 涉 
及 这 个 谜 题 的 概率 论 入 门 教 材 都 是 不 完整 的 . 尽管 这 些 计算 比 我 们 在 婚姻 /秘书 问 


道 智力 恋 题 来 自 于 游戏 节目 Zets Make 4 Deal, 主持 人 就 是 蒙 提 起 


题 中 看 到 的 要 简单 , 但 答案 在 许多 人 看 来 是 违反 直觉 的 , 并 且 引发 了 大 


量 的 讨论 . 这 
/7 


小 . 


蒙 提 霍 尔 问题 : 假设 你 正在 参加 一 个 游戏 节目 . 如 果 选 择 正确 的 话 , 你 就 有 机 会 
赢得 一 辆 汽车 . 有 三 肩 紧 闭 的 门 , 其 中 一 扇 门 后 面 停放 着 一 辆 汽车 , 而 另外 两 扇 


门 后 面 都 是 山羊 . 你 随便 选择 一 扇 门 , 比如 3 号 门 . 然后 主持 人 会 扩 


换 一 扇 门 ( 换 成 2 号 门 ), 还 是 坚持 第 一 次 的 选择 ? 你 应 该 换 吗 ? 


让 你 看 到 后 面 是 一 上 只 山羊 , 不 妨 设 这 是 1 号 门 . 接 下 来 , 主持 人 会 问 你 : 你 是 想 


另 一 书 门 


乍 一 看 , 这 似乎 很 简单 . 因为 现在 只 剩 下 两 扇 门 了 , 奖品 出 现在 和 有 


E 何 一 扇 门 后 


面 的 概率 是 相等 的 , 所 以 赢得 汽车 的 机 会 只 有 50%, 那么 换 不 换 门 已 经 无 关 紧 要 了 . 


你 觉得 这 个 逻辑 可 信 吗 ? 在 继续 往 下 读 之 前 , 好 好 地 想 一 想 这 个 问题 . 


试 着 动手 来 


解决 这 个 问题 吧 , 可 以 用 纸 笔算 一 下 , 也 可 以 编写 一 段 代码 模拟 该 游戏 100 万 次 ， 


来 对 比 一 下 换 门 或 者 不 换 门 都 会 发 生 什么 . 


25.2.1 一 个 简单 的 解决 方案 


分 析 这 类 问题 的 一 种 好 方法 就 是 详细 地 列 出 所 有 的 可 能 性 . 我 们 假设 每 个 结 


果 都 是 等 可 能 的 . 我 们 必须 在 三 扇 门 之 间 分 配 两 具 (同样 不 吸引 人 的 ) 


(非常 受 欢 迎 的 ) 汽车 . 一 共有 三 种 分 配方 法 : 汽车 在 1 号 门 后 , 汽车 在 2 号 门 后 
以 及 汽车 在 3 号 门 后 . (如 果 还 记得 多 项 式 系数 , 我 们 正在 做 的 就 是 看 一 看 从 CGG 


中 可 以 得 到 多 少 个 不 同 的 单词 .) 


山羊 和 一 辆 


: 
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在 表 25-1 中 , 我 们 列 出 了 两 只 山羊 和 一 辆 汽车 的 所 有 可 能 安排 , 以 及 在 每 一 种 
情况 下 最 初 选择 3 号 门 的 结果 . 注意 , 因为 这 个 问题 具有 对 称 性 , 所 以 不 妨 设 我 们 
选择 了 3 号 门 . 如 果 你 不 满意 这 个 选择 , 那 就 再 分 析 一 遍 , 然后 选择 1 号 门 或 者 2 
号 门 . 你 会 看 到 完全 相同 的 计算 和 结果 . 


表 25-1  ” 当 我 们 选择 3 号 门 时 , 对 蒙 提 霍 尔 问题 的 分 析 


1 号 站 后 2 号 门 后 3 号 门 后 不 换 门 的 结果 换 门 的 结果 
汽车 羊 六 获得 山芋 获得 汽车 
羊 汽车 羊 获得 山羊 获得 汽车 

羊 羊 汽车 获得 汽车 获得 山羊 


这 个 问题 还 有 一 个 隐 含 的 假设 , 明确 地 说 就 是 : 主持 人 永远 不 会 打开 后 面 有 汽 
车 的 那 扇 门 ! 为 什么 ? 游戏 的 目的 是 要 有 戏剧 性 、 刺 激 感 和 悬念 . 如 果 我 们 选择 了 
3 号 门 , 而 主持 人 打开 2 号 门 并 看 到 后 面 是 一 辆 汽车 , 那么 我 们 是 否 换 门 就 没有 任 
何 意义 了 , 无 论 如 何 都 只 能 得 到 一 只 山羊 . 我 们 和 观众 都 知道 这 一 点 . 没有 悬念 , 也 
不 需要 做 出 任何 决定 . 
因此 , 主持 人 绝 不 会 打开 有 汽车 的 那 扇 门 . 这 意味 着 什么 呢 ? 如 果 我 们 选 的 门 
后 面 是 一 只 山羊 , 那么 剩 下 两 扇 门 后 面 分 别 是 一 上 只 山羊 和 一 辆 汽车 . 既然 主持 人 不 
能 打开 有 汽车 的 那 扇 门 , 他 就 一 定 会 把 有 山羊 的 那 扇 门 打开 , 那么 剩 下 的 门 后 面 
i 一 定 是 汽车 ! 因此 , 当 我 们 选 的 门 后 面 是 一 只 山羊 时 (发 生 的 概率 是 2/3), 如 果 
决定 换 门 , 我 们 就 赢 了 ! 如 果 我 们 的 门 后 有 一 辆 汽车 呢 ? 此 时 , 主持 人 可 以 随意 
开 剩 下 两 扇 门 中 的 任意 一 扇 , 因为 这 两 扇 门 后 都 是 山羊 . 在 这 种 情况 下 , 如 果 选 指 
换 门 , 我 们 就 一 定 会 失败 . 因此 , 换 门 会 让 我 们 失去 1/3 的 机 会 (这 是 我 们 最 初 
中 汽车 的 概率 ). 在 表 25-1 中 , 我 们 给 出 了 上 述 分 析 的 总 结 . 
注意 , 如 果 坚 持 3 号 门 , 我 们 赢 的 概率 只 有 1/3, 但 如 果 选 择 换 门 , 那么 赢 的 概 
率 就 是 2/3. 因此 , 换 门 使 得 我 们 赢 的 概率 变 成 了 之 前 的 2 倍 ! 另外 , 还 要 注意 到 这 
个 表格 有 多 稀 下 . 我 们 没有 把 问题 划分 成 大 量 的 子 情形 (我 们 选择 3 号 门 , 主持 人 
打开 2 号 门 ; 我 们 选择 3 号 门 , 主持 人 打开 1 号 门 ). 有 时 候 需要 这 样 做 , 但 有 时 不 
需要 . 我 们 最 好 从 更 高 的 层次 考虑 问题 . 主持 人 打开 哪 扇 门 并 不 重要 , 关键 在 于 我 
们 换 门 还 是 不 换 门 . 很 重要 的 一 点 是 , 要 记 住 在 分 析 中 哪些 量 是 重要 的 . 问题 不 在 
于 应 该 换 到 2 号 门 还 是 1 号 门 , 而 在 于 是 否 应 该 换 门 . 因此 , 我 们 得 到 了 一 个 暗示 ， 
访 记 这 些 标签 可 能 会 更 好 .……… 


a 


#0F 五 


H 一 


Ga 


25.2.2 ”一 种 极端 情形 


当 有 困惑 时 , 利用 极端 情形 验证 你 的 直觉 通常 是 一 种 有 效 的 策略 . 利用 这 种 策 
略 , 为 了 和 弄 清楚 三 肩 门 的 情形 , 我 们 现在 考察 1 000 000 扇 门 的 情况 . 这 个 游戏 需要 
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很 多 山羊 ! 但 是 , 我 们 假设 人 们 对 数学 很 有 兴趣 , 并 且 很 多 人 淘 望 看 到 网 络 有 尼 够 


的 资源 用 


万 遍 门 来 建造 超级 舞台 . 


其 中 一 扇 i 


同样 ， 
选择 后 , 主 j 


了 ] 后 男 
持 人 打开 除 一 局 门 之 外 的 所 有 


其 他 门 后 面 都 是 山羊 . 当 玩 家 做 出 最 初 的 
门 . 如 果 像 之 前 那样 做 严格 的 分 析 , 我 们 


是 一 辆 汽车 ， 


会 发 现 剩 下 的 这 扇 门 后 有 汽车 的 概率 是 999 999/1 000 000. 这 里 还 有 另外 一 种 思 


路 . 在 1 000 000 扇 门 
实 上 , 成 功 的 概率 只 


们 并 不 
的 意思 是 , 当 把 这 999 998 扇 门 打 
面 有 


有 1/1 000 000! 因 
后 有 汽车 的 概率 是 999 999/1 000 000, 如 果 我 们 知道 汽车 不 在 其 中 999 998 局 门 之 
后 , 那么 整个 概率 999 999/1 000 000 一 定 会 塌 缩 到 剩 下 的 那 扇 门 上 . 你 要 记 住 , 我 
] 并 不 是 说 某 一 扇 特 定 门 之 后 始终 有 一 多 


中 , 你 能 选中 有 汽车 的 那 扇 门 的 概率 有 多 大 ? 根本 不 可 能 ! 事 
此 , 在 剩 下 的 999 999 扇 门 中 , 其 中 一 扇 门 


汽车 的 概率 是 999 999/1 000 000. 我 们 
号 是 多 少 , 它 后 


之 后 , 不 管 最 后 剩 下 的 这 扇 门 编 


25.2.3 ” 蒙 提 霍 尔 


辆 汽车 的 概率 就 是 999 999/1 000 000. 
问题 的 代码 


由 于 本 章 的 一 个 主要 目的 是 帮助 你 掌握 编程 , 所 以 我 们 最 后 给 出 一 个 简单 的 程 


montyhall [num_] 


switchwin = 0; (* 


序 来 估算 , 在 蒙 提 霍 尔 问 题 中 选择 换 门 时 


全 已 全 


用 觅 | 


全 已 全 


用 剧 


的 概 


的 概率 , 以 及 选择 不 换 门 时 


:= Module [{}，(* num 是 模拟 次 数 *) 


记录 当选 择 换 门 时 能 赢 的 概率 *) 


noswitchwin = 0; (* 当选 择 不 换 门 时 能 赢 的 概率 *) 


For[n = 1, n <= num, n++, 


{ 
(* 考虑 到 一 般 性 


， 假 设 玩家 每 次 都 选择 1 号 门 *) 


(* 使 用 内 置 函数 随机 选 定 有 奖品 的 那 肩 门 *) 


(* 从 [0,1] 中 随机 选取 一 个 数 ， 那么 如 果 1 号 门 


最 多 有 1/3 的 概率 有 奖品 *) 


doorofprize = RandomInteger[{1, 3}]; 
(+ 如 果 1 号 门 后 有 奖品 ， 那 么 不 换 门 就 能 赢 *) 
(* 换 门 则 会 输 *) 


If [doorofprize == 1, noswitchwin = noswitchwin + 1] ; 


(* 如 果 奖 品 在 2 号 门 或 3 号 门 后 面 ， 那 么 换 门 


Ab 高 
月 已 须 . 


不 换 门 则 会 输 *) 


If [doorofprize == 2 || doorofprize == 3， 


switchwin = switchwin + 1]; 


]] ; (x 结束 对 n 的 循环 *) 


Print["Percent of 
A "] ; 


Print["Percent of 


time won When switch: ", 100. switchwin/num, 


time won When don’t switch: "， 


100. noswitchwin/num, "%."]; 
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运行 程序 10 000 000 次 产生 了 下 列 结果 : 


Percent of time won when switch: 66.6668%. 


Percent of time won when don’t switch: 33.3332%. 


25.3 ”两 个 随机 程序 
本 章 最 后 给 出 一 些 代 码 来 解决 本 书 前 面 的 一 些 问题 . 之 所 以 选择 这 些 问题 , 是 
因为 它们 没有 什么 特别 之 处 , 是 概率 论 中 经 常 遇 到 的 一 些 典型 问题 . 
25.3.1 ”有 放 回 取样 与 无 放 回 取样 
这 里 的 代码 来 自 6.1.3 节 , 这 一 节 考虑 了 有 放 回 取 样 与 无 放 


marblecheck[num_] := Module[{}, 


Tl 


取样 的 差别 . 


countwith = 0; 
countwithout = 0; 
list = {}; 
For[m = 1, m <= 100, m++, list = AppendTo[list, m]]; 
p[1] = .1; p[2] = .3; p[3] = .6; p[4] = .9; 
For[n = 1, n <= num, n++ m 

{ 

X = Floor[4*Random[]] + 1; 

numgold = 0; 

For[i = 1, i <= 5, i++, 

If [Random[] > p[x], numgold = numgold + 1]]; 
If[numgold <= 1, countwith = countwith + 1]; 


y = Floor[4*Random[]] + 1; 
numgold = 0; 
templist = RandomSample[list, 5]; 
cutoff = Floor[p[ly]*100]; 
numgold = 0; 
For[m = 1, m <= 5, m++, 
If [templist[[m]] > cutoff, numgold = numgold + 1]]; 


If[numgold <= 1, countwithout = countwithout + 1]; 


站; (* 结束 对 n 的 循环 *) 
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Print["Observed probability at least four purple 
(without replacement) is "， 


100 countwithout/num 1.0，"% (32.0597 predicted) ."] ; 


Print["Observed probability of getting at least four 
purple (with replacement) 
is ", 100 countwith/num 1.0, "% (32.1685 predicted)."]; 
Print["Did ", num, " iterations ."] ; 
]; 
下 面 的 代码 取 自 6.3.3 节 , 答案 是 37 092 537, 几 分 钟 后 就 可 以 得 到 这 个 答案 . 


solns = 0; 


For[xi = 0, xi1 <= 1996/2, xi++, 
For[x2 = 0, x2 <= (1996 - 2 x1)/2, x2++, 
For[x3 = 0, x3 <= (1996 - 2 xX1 - 2 x2)/3, x3++, 
If[Mod[1996 - 3 x3 - 2 x2 - 2 x1, 3] == 0, solns = solns + 1]; 
]]]; 


Print [solns] 
25.3.2 ”期 望 

在 这 个 问题 中 , 我 们 抛掷 4 枚 硬币 . 如 果 正 面 的 个 数 少 于 2, 就 重新 抛掷 所 有 
硬币 (如 果 正 面 个 数 不 少 于 2, 结果 就 保留 下 来 ). 在 完成 后 , 对 于 每 个 正面 , 我 们 都 
能 得 到 1 美元 . 问题 是 期 望 值 是 多 少 ? 结果 应 该 是 36/16 或 19/8. 下 面 的 代码 文 持 
了 这 个 答案 . 


retoss [num_] := Module[{}, 


winnings = 0; 
For[n = 1, n <= num, n++, 
{ 
temp = 0; 
For[i = 1, i <= 4, i++, x[i] = Floor[2*Random[]]]; 
If [Sum[x[i], {i, 1, 4}] >= 2, temp = Sum[x[i], {i, 1, 4}], 
{ 
For[i = 1, i <= 4, i++, x[i] = Floor[2*Random[]]]; 
temp = Sum[x[i], {i, 1, 4}]; 
4] 
winnings = winnings + temp; 
EB 


Vinnings = 1. winnings / nunm; 
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Print["Ran ", num, " simulations."]; 

Print["Predict ", 19./8, " and got ", winnings, "."]; 

本 

进行 1 000 000 次 模拟 后 , 我 们 得 到 了 2.376 01 (我 们 的 预测 值 是 2.375). 


25.4 习 题 


下 列 习题 都 与 经 典 的 秘书 问题 有 关 , 除非 另 有 说 明 . 
习题 25.4.1 ”证 明 式 (25.1) 的 近似 结果 . (你 可 以 上 网 搜索 欧 拉 -麦克 劳 林 公 式 ). 
习题 25.4.2 ”利用 微 积 分 的 二 阶 导数 来 证 明 (2 在 x = e 时 取 到 最 大 值 . 
习题 25.4.3 ” 求 出 最 小 的 N, 使 得 log(n)/n < 1/e 对 所 有 的 郊 关 N 均 成 立 . 
习题 25.4.4 ”假设 我 们 考察 前 p% 的 申请 人 , 然后 聘用 比 这 些 人 都 要 优秀 的 第 一 个 申请 人 
(所 以 = pn), 那么 选中 最 优秀 申请 人 的 概率 约 为 多 少 ? 
习题 25.4.5 ” 当 n 较 大 时 , 利用 最 优 策略 找到 , 作为 n 的 一 小 部 分 被 面试 过 的 预期 人 数 是 多 
少 . 
习题 25.4.6 ”编写 一 段 代 码 , 找到 当 n 较 小 时 的 最 优 大. 
习题 25.4.7 ”对 于 每 一 个 n, 画 出 选中 最 优秀 申请 人 的 最 大 概率 并 与 直线 1/e 做 比较 . 关于 
这 个 概率 的 收敛 性 , 请 给 出 简单 的 论述 . 
习题 25.4.8 ”利用 最 优 策略 从 n 个 人 中 选 出 最 优秀 申请 人 的 概率 是 否 随 着 n 的 增加 在 严格 
递减 ? 
习题 25.4.9 ”证 明 : 利用 最 优 策略 求 出 的 成 功 概率 关于 n 单调 减少 . 也 就 是 说 , 对 于 所 有 的 
n, Pr( 成 功 |n 个 申请 人 ) < Pr( 成 功 |n 十 1 个 申请 入). 
习题 25.4.10 ” 求 出 利用 最 优 策略 没有 选 出 任何 申请 人 的 概率 . 
习题 25.4.11 ”假设 我 们 真 的 需要 聘用 一 个 人 , 所 以 如 果 当 第 n 个 人 面试 时 , 我 们 还 没有 聘 
任何 申请 人 , 那么 就 聘用 第 n 个 人 , 而 不 考虑 其 相对 级 别 . 求 出 我 们 聘用 到 最 差 申请 人 
的 概率 . 
习题 25.4.12 ”严格 地 证 明 所 分 析 的 策略 是 最 优 策略 . 
习题 25.4.13 ”假设 我 们 不 寻找 最 优秀 的 申请 人 ,只 要 求 聘用 到 前 两 个 最 优秀 的 申请 人 又 
即 可 . 现在 的 最 优 策 略 是 什么 ? 成 功 的 概率 是 多 少 ? 
习题 25.4.14 ”推广 上 一 道 习 题 , 现在 只 要 求 聘 用 到 前 c 个 最 优秀 的 申请 人 之 一 即 可 , 其 中 c 
是 某 个 固定 值 . 
习题 25.4.15 ”对 上 一 题 进行 推广 , 假设 c 随 着 n 增加 , 比如 c = n/10 ( 即 某 个 优秀 程度 位 于 
前 10% 的 申请 人 ) 或 c = n/2 ( 某 个 高 于 平均 水 平 的 申请 人 ). 你 能 得 到 关于 c= (1 一 p)n 
的 公式 吗 ( 某 个 优秀 程度 位 于 前 p% 的 申请 人 )? 
习题 25.4.16 ”假设 申请 人 的 总 数 n 是 未 知 的 , 但 我 们 知道 ” 取 自 某 个 服从 [a, 06] 上 均匀 分 
布 的 随机 变量 . 现在 最 优 策略 是 什么 ? 成 功 的 概率 是 多 少 ? 
习题 25.4.17 ”假设 申请 人 的 总 数 n 是 未 知 的 , 但 我 们 知道 n 取 自 某 个 服从 泊 松 分 布 的 随机 
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变量 , 其 


Er 


习题 25.4.18 


P 泊 松 分 布 的 参数 是 已 知 的 入 . 现在 最 优 策略 是 什么 ? 成 功 的 概率 是 多 少 ? 


假设 我 们 有 一 个 最 多 可 以 承重 100 公斤 的 背包 , 可 以 装 三 样 东 


西 . 第 一 样 东 


6 重 51 公斤 , 且 每 公斤 价值 150 美元 ; 第 二 样 东西 重 50 公斤 , 且 每 公斤 价 


bay SA 
第 三 样 东 


值 100 美元 ; 


i 重 50 公斤 , 且 每 公斤 价值 99 美元 . 设 z 表示 我 们 装 入 的 第 7 样 东西 的 数 


量 . 对 于 每 一 样 东 西 , 如 果 我 们 都 能 装 入 任何 一 个 实数 值 数量 , 那么 装 入 的 每 样 东西 的 数 


量 是 多 少 


? 如 果 每 样 东西 都 只 能 装 入 整数 值 数 量 呢 ? 
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本 章 将 讨论 如 何 阅读 一 个 证 明 , 阐述 一 些 证 明 命题 的 常见 方法 , 并 且 强 调 一 些 
不 起 作用 、 应 不 惜 一 切 代 价 避 免 的 方法 ! 当 从 标准 课程 (如 微 积分 ) 向 高 等 课程 过 
渡 时 , 学 生 们 经 常会 感到 诅 丧 . 这 是 因为 标准 课程 中 没有 太 多 的 定理 , 并 且 大 部 分 
练习 都 是 机 械 且 直接 的 (如 果 家 庭 作业 来 自 关于 分 部 积分 的 章节 , 那么 为 了 求 积分 ， 
你 需要 做 什么 是 很 明显 的 ), 但 在 高 等 课程 中 , 每 一 节 中 主要 定理 的 证 明 通 常 被 留 作 
课 后 习题 . 即使 你 非常 幸运 地 磁 到 一 本 能 提供 证 明 的 书 , 也 很 容易 只 见 树木 、 不 见 
森林 . 这 意味 着 , 当 你 阅读 证 明 时 , 可 以 单独 地 理解 每 一 行 . 你 可 以 理解 它 是 如 何 
从 一 行 延 伸 到 另 一 行 的 , 但 是 完全 不 清楚 作者 为 什么 可 以 正确 地 选择 从 这 一 行 过 渡 
到 那 一 行 . 你 对 证 明 中 的 转折 有 些 恐 惧 , 因为 接 下 来 证 明 的 走向 将 由 你 来 决定 . 学 
会 如 何 看 出 证 明 思 路 、 学 会 下 一 步 应 该 怎么 做 确实 很 困难 , 但 这 样 做 对 你 在 数学 领 
域 的 成 长 至 关 重 要 . 接 下 来 的 目标 是 详细 地 描述 许多 常用 方法 , 希望 学 习 这 些 方法 
可 以 帮助 你 理解 和 构造 证 明 . 

我 们 将 介绍 以 下 证 明 技 巧 : 

(1) 归纳 法 证 明 ; 

2) 分 组 证 明 ; 
3) 利用 对 称 性 证 明 ; 
4) 变 力 证 明 ; 
5) 通过 比较 或 故事 来 证 明 ; 
6) 反 证 法 ; 
) 
) 
) 
0 


7) 穷 举 法 (分 治 法 ); 
8) 举 反 例证 明 ; 

9) 通过 推广 例子 来 证 明 ; 

10) 铝 梨 原理 证 明 法 ; 

11) 添加 0 或 乘 以 1 的 证 明 法 . 


A.1 如 何 阅读 证 明 


在 教材 中 , 你 会 发 现在 证 明 的 结尾 处 通常 有 一 个 正方 形 , 比如 口 . 这 是 为 了 提 
醒 你 论证 已 经 结束 , 并 且 完 成 了 对 命题 的 证 明 . 之 所 以 这 样 做 是 因为 我 们 常常 紧 跟 
着 论述 逐 行 往 下 看 , 以 至 于 没有 意识 到 论证 已 经 结束 ! 还 有 些 人 会 写 qed 或 Q.E.D.， 
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这 是 拉丁 语 quod erat demonstrandum 的 缩写 , 意思 是 某 物 已 被 证 明 . 有 时 , 作者 也 
会 在 论证 开始 时 写 “ 证 明 ”. 这 些 都 是 为 了 让 你 了 解 正在 发 生 的 事情 , 有 助 于 防止 
证 明 与 文本 其 余部 分 混在 一 起 . 

在 研究 证 明 技巧 之 前 , 给 出 一 些 关 于 阅读 证 明 的 一 般 性 建议 . 当 第 一 次 通读 证 
明 时 , 不 要 太 关 注 掌握 住所 有 细节 , 只 需要 对 正在 发 生 或 正在 讨论 的 事情 有 一 个 大 
致 的 了 解 即 可 . 如 果 无 法 逐 行 理解 论述 , 你 也 不 必 担 心 . 

第 一 步 是 确保 你 能 够 理解 条 件 和 断言 . 如 果 可 以 的 话 , 举 几 个 满足 条 件 的 例子 ， 
然后 说 明 断 言 天 于 这 些 例 子 是 正确 的 . 有 时 候 , 尝试 一 些 极端 的 例子 是 非常 好 的 ， 
至 少 这 些 例子 比较 容易 . 如 果 条 件 中 给 出 了 连续 函数 , 那么 可 以 试 着 构造 一 个 常数 
函数 . 对 于 剧烈 振荡 的 函数 , 可 以 尝试 zz sin(1/z)， 如 果 是 在 某 一 点 处 不 可 微 的 函 
数 , 可 以 试 一 试 |z|. 另外 , 也 尝试 一 些 不 满足 定理 假设 的 例子 . 在 这 种 情况 下 , 结论 
有 可 能 成 立 , 也 有 可 能 不 成 立 . 做 一 些 像 这 样 的 验证 可 以 让 你 对 正在 发 生 的 事情 有 
一 定 的 了 解 . 另外 , 在 验证 过 程 中 , 你 可 能 会 开始 看 到 证 明 都 会 用 到 些 什么 ， 当 你 
找到 一 些 使 结论 无 法 成 立 的 例子 时 , 这 一 点 更 能 得 到 充分 体现 , 因为 定理 的 假设 必 
须 以 某 种 方式 避免 这 种 坏 情 况 发 生 . 

试 着 去 感受 一 下 哪些 例子 是 可 行 的 、 哪些 是 不 可 行 的 , 再 回 过 头 来 深入 思考 这 
些 假设 . 这 些 假设 是 如 何 应 用 在 论证 中 的 ? 当 阅 读 这 些 假设 时 , 你 的 第 一 个 想法 应 
该 是 : 我 知道 的 哪些 定理 会 用 到 这 些 条 件 呢 ? 例如 , 如 果 有 一 个 假设 是 函数 是 可 微 
的 , 那么 你 或 许 会 开始 考虑 使 用 中 值 定 理 . 又 例如 , 你 认为 f 可 能 是 一 个 n 次 多 项 
式 , 此 时 利用 代数 基本 定理 可 知 f 有 个 复 根 . 你 知道 的 越 多 , 问题 就 会 变 得 越 容 
易 . 我 会 在 数论 方面 做 很 多 工作 . 如 果 已 知 两 个 数 z 和 y 是 互 素 的 , 那么 我 首先 想 
到 的 是 欧 几 里 得 算法 , 也 就 是 说 , 存在 整数 a 和 5 使 得 az+by = I( 比 如 ,17 和 11 是 
互 素 的 , 并 且 2:17 一 3.11 = 1). 我 为 什么 会 首先 想到 这 一 点 ? 经 验 一 一 我 已 经 解决 
了 很 多 问题 , 所 以 知道 这 通常 是 一 个 很 好 的 开端 . 你 解决 的 问题 越 多 , 事情 就 会 越 
容易 . 假设 是 路 标 , 它们 是 引导 证 明 展开 的 标志 . 花 时 间 去 思考 它们 , 这 是 值得 的 . 

如 果 用 不 到 这 些 假设 呢 ? 好 吧 , 奇怪 的 事情 发 生 了 : 既然 用 不 到 这 些 假设 , 为 
什么 又 给 出 它们 呢 ? 更 有 可 能 的 情况 是 , 这 些 假设 有 时 并 不 是 真正 需要 的 , 给 出 它 
们 是 为 了 让 你 利用 其 他 强大 的 定理 来 简化 证 明 . 例如 , 对 微 积分 基本 定理 的 证 明 只 
要 求 函 数 f 在 有 限 区 间 [a,9] 上 连续 , 但 每 次 讲 微 积分 时 , 我 总 是 假设 f/ 是 存在 、 
连续 且 有 界 的 . 这 个 假设 不 是 必要 的 , 却 可 以 简化 证 明 . 如 果 继 续 销 研 数学 , 你 将 
会 重 温 以 前 的 定理 , 并 试图 找到 能 够 得 到 相同 结果 的 最 弱 条 件 . 

最 后 , 在 阅读 证 明 的 过 程 中 , 不 要 为 了 弄 清楚 每 一 步 论 证 而 感到 担忧 . 先 略 读 
整个 论证 , 试 着 了 解 主要 思想 . 看 看 证 明 中 都 用 到 了 哪些 结果 ? 粗略 地 说 , 我 们 为 
什么 能 使 用 这 些 结果 ? 有 时 候 , 调用 一 个 定理 需要 满足 大 量 技术 条 件 . 在 这 种 情况 
下 , 很 多 论证 都 是 为 了 说 明 这 些 条 件 能 够 被 满足 . 第 一 次 读 证 明 时 , 你 可 以 把 这 些 
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内 容 暂 时 忽略 掉 . 不 妨 像 这 样 来 思考 : 好 的 , 我 们 要 证 明 商 是 一 个 有 限 4 


成 的 阿 贝 


尔 群 , 而 接 下 来 的 几 行 就 是 为 了 说 明 这 一 点 , 我 现在 就 接受 这 个 说 法 . 当然 , 之 后 你 
应 该 回 过 头 去 试 着 理解 这 些 论述 , 但 也 不 要 沉迷 其 中 , 否则 会 影响 你 的 整个 证 明 思 


路 . 通常 情况 下 , 教材 和 论文 会 把 这 些小 论述 单独 放 在 证 明之 前 或 之 后 


并 称 之 为 


引 理 ， 引 理 是 一 个 较 小 的 结果 , 它 是 证 明 主要 结果 的 一 个 组 成 部 分 有 时候 , 作者 

会 把 这 些 引 理 放 在 最 前 面 , 那么 当 看 到 定理 时 , 你 已 经 见 到 了 需要 用 到 的 所 有 内 容 . 

有 时 这 些 内 容 也 被 放 在 后 面 , 这 样 可 以 避免 技术 上 的 中 断 . 每 一 种 方法 都 不 错 . 
现在 给 出 关于 阅读 证 明 的 最 后 一 点 说 明 . 你 最 终 会 看 到 不 失 一 般 性 这 个 表达 . 


通常 情况 下 , 作者 随后 会 讨论 一 种 情况 , 并 说 其 他 情况 也 是 类 似 的 . 如 果 你 刚 开始 
学 习 证 明 , 那么 应 该 把 所 有 情况 都 仔细 地 论述 一 遍 .“ 不 失 一 般 性 ”这 个 表达 可 能 会 
非常 危险 , 因为 有 时 不 同 的 情况 之 间 会 有 一 些 差 别 , 那么 唯一 的 办 法 就 是 把 每 一 种 
情况 都 论证 一 遍 . 如 果 所 有 内 容 都 经 过 了 验证 , 并 且 各 种 情况 的 论述 确实 相同 , 那 


么 为 了 节省 时 间 和 空间 , 数学 家 们 通常 只 详细 地 论述 其 中 一 种 情况 . 当 你 阅读 了 某 


个 证 明 后 , 把 其 他 情形 的 证 明 补充 完整 将 是 一 个 不 错 的 练习 . 
好 了 , 现在 可 以 探索 不 同 的 证 明 方法 了 ! 


A.2 ”归纳 法 证 明 


本 节 是 关于 归纳 法 证 明 的 [MT-B] 附录 的 扩展 . 这 种 方法 则 在 处 理 


对 于 每 一 个 正 整 数 nn。 有 一 个 陈述 P(n), 现在 想 要 证 明 P(n) 对 所 有 的 ni] 
如 , P(n) 指出 , 前 个 奇数 的 和 始终 是 一 个 完全 平方 和 . 一 种 可 能 的 做 法 是 计算 n 


以 下 情况 : 
的 成 立 . 例 


取 不 同 值 的 结果 . 这 样 我 们 就 得 到 了 前 四 个 值 : 1, 4, 9 和 16, 并 相信 结论 是 正确 的 . 
但 相信 并 不 是 证 明 , 结论 对 最 初 儿 个 值 成 立 并 不 意味 着 它 接 下 来 仍然 成 立 . 如 果 对 


于 最 终 找到 一 个 使 得 P(n) 不 成 立 的 n, 那么 这 个 陈述 就 是 错 的 . 但 是 , 如 果 对 于 检 
验 的 每 一 个 值 , P(n) 都 始终 成 立 呢 ? 这 是 否 意味 着 它 一 定 为 真 ? 很 遗憾 , 并 非 如 此 . 


也 许 我 们 检验 的 值 还 不 够 多 . 


举 一 个 可 能 出 错 的 例子 , 考虑 著名 的 多 项 式 f(z) = z2 +z 十 和 欧 拉 对 这 个 
多 项 式 很 感 兴趣 , 你 马上 就 会 明白 这 是 为 什么 . 现在 来 看 看 其 中 一 些 值 , 如 表 A-1 


所 示 . 


为 了 节省 空间 , 我 们 只 记录 了 f(n) 的 一 部 分 取 值 . 这 项 小 研究 表明 了 当 


nN 小 


于 或 等 于 38 时 , f(n) 是 一 个 素数 . 基于 以 上 数据 , 我 们 自然 会 推测 , 对 于 任意 的 


不 是 


正 整 数 n, f(n) 始终 是 个 素数 . 虽然 这 些 数据 印证 了 这 一 点 , 但 验证 某 些 值 } 


证 明 


现在 该 怎么 做 呢 ? 我 们 可 以 让 n 的 值 变 得 越 来 越 大 , 并 看 看 这 会 发 生 什么 . 在 


这 种 情况 下 , 我 们 发 现 f(39) = 1601 是 个 素数 , 但 f(40) = 1681 = 412 


合 数 ， 
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f(49) = 2491 = 47.53 也 是 个 合 数 . 现在 , 我 们 看 到 模式 被 打破 , 一 旦 出 现 了 使 结论 
失败 的 值 , 我 们 就 知道 这 个 结论 不 可 能 始终 成 立 . 


表 A-1 多 项 式 f(x) 二 x? 十 x 十 1 的 值 


n f(n) jn) 的 素性 
1 41 素数 
2 43 素数 
3 47 素数 
37 1447 素数 
38 1523 素数 


作为 男 一 个 例子 , 现在 重新 考虑 前 ”个 奇数 的 和 . 我 们 可 以 像 之 前 那样 做 一 个 
类 似 的 表格 , 即 表 A-2. 


表 A-2 奇数 之 和 


n 前 n 个 奇数 之 和 和 的 大 小 
i 1 

2 1 十 3 4 

3 1+3+5 9 

4 1+3+5+7 16 
100 1 十 3 十 … 十 197 十 199 10 000 


你 看 到 其 中 的 规律 了 吗 ? 前 ”个 奇数 之 和 看 起 来 好 像 是 mn?. 与 上 一 个 例子 不 
同 , 这 次 的 猜想 是 正确 的 . 无 论 做 多 少 检验 , 这 个 规律 将 始终 保持 不 变 . 然而 , 只 依 
靠 观察 并 不 是 一 种 证 明 . 

我 们 需要 一 种 方法 来 证 明 这 样 的 陈述 . 我 们 会 快速 描述 一 种 强大 的 方法 , 即 通 
过 归纳 来 证 明 , 它 可 以 用 来 解决 各 种 各 样 的 问题 . 这 种 方法 的 一 般 框 架 是 , 我 们 有 
一 个 陈述 P(n), 并 想 要 确定 它 是 否 对 所 有 的 正 整数 ”都 成 立 . 


证 明 技巧 一 一 归纳 法 证 明 : 如 果 以 下 两 个 条 件 都 能 满足 , 那么 对 所 有 的 正 整 数 
n, 陈述 P(n) 均 成 立 . 
。 基 本 步骤 : P(1) 成 立 . 
。 归纳 步骤 : 只 要 P(n) 成 立 , P(n 二 1) 就 成 立 . 
归纳 法 证 明 是 证 明 结论 的 一 种 非常 有 用 的 方法 . 在 本 附录 中 , 我 们 会 看 到 很 多 
这 样 的 例子 ， 这 种 方法 之 所 以 有 效 与 其 基本 逻辑 有 关 . 我 们 假设 下 面 两 句 话 是 正 
确 的 : 
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P(1) 成 立 ; 
对 于 所 有 的 n> 1, P(n) 成 立 绚 含 着 P(n 十 1) 成 立 . 


在 第 二 个 句子 中 , 令 n= 1. 由 于 P(1) 成 立 , 并 且 P(1) 列 含 着 P(2), 所 以 P(2) 一 
定 成 立 . 现在 ， 令 第 一 个 句子 里 的 n= 二 2. 因为 P(2) 成 立 , 且 P(2) 理 含 着 P(3), 所 
以 P(3) 一 定 成 立 . 继续 推导 下 去 就 完成 了 证 明 . 验证 第 一 个 陈述 称 为 基本 步骤 , 验 
证 第 二 个 陈述 称 为 归纳 步骤 . 在 验证 归纳 步骤 时 , 我 们 要 假设 P(n) 成 立 , 这 称 为 归 
纳 假设 . 有 时 候 , 我 们 不 从 = 1 开始 , 而 是 从 n= 0 开始 . 但 通常 情况 下 , 我 们 可 
以 从 任何 一 个 no 开始 , 然后 证 明 当 nz no 时 , P(n) 成 立 . 

下 一 小 节 会 给 出 四 个 利用 归纳 法 证 明 的 标准 例子 和 一 个 错误 的 例子 ， ne 
个 例子 是 最 典型 的 . 当 掌 握 了 归纳 法 证 明之 后 , 你 可 能 会 回 过 头 来 考虑 下 面 的 习题 
这 是 一 个 关于 斐 波 那 契 数 的 有 趣 问题 

习题 A.2.1 ( 齐 肯 多 夫 定 理 ) 考虑 由 不 同 的 斐 波 那 契 数 构 成 的 集合 {1,2, 3,5， 
8,13,…】}, 其 中 羽 ,j2 = 41 十 Fn. 证 明 : 每 一 个 正 整 数 都 可 以 唯一 地 写成 若干 个 
不 同 的 斐 波 那 契 数 之 和 , 其 中 不 能 出 现 两 个 连续 的 辈 波 那 契 数 . 也 就 是 说 , 对 于 任 
意 的 n, 存在 一 组 ei;(n) e {0,1} 使 得 


一 


n 一 Gn)F, el(n)jer(n) = 0, 其 中 ief{1 ,ln)—1}. 
类 似 的 结论 是 否 对 所 有 的 递 推 关系 都 成 立 ? 如 果 不 是 , 你 能 找到 另 一 个 使 得 这 个 结 
果 成 立 的 递归 关系 式 吗 ? 
A.2.1 整数 之 和 
入 P(n) 的 陈述 如 下 


n(n+t+1) 
DD 


这 里 使 用 了 求 和 符号 , 它 是 一 种 非常 紧凑 的 表达 方式 . 把 上 式 展开 , 2 


Dj = 1+2+.…+k. 
太 寺 二 


Sy 
菲 
了 
La 
Du 


更 一 般 地 ， 
>》 ak 一 Q1 十 Qa2 十 …… 十 Qn， 


可 能 是 利用 归纳 法 证 明 的 最 著名 的 例子 . 据说 , 伟大 的 高 斯 在 5 岁 时 就 成 功 
Nt 在 这 个 故事 里 , 他 的 老师 那天 心情 很 糟糕 (我 们 都 是 这 样 ), 想 通 
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全 孩子 们 安排 一 些 事情 来 打发 他 们 , 但 他 没有 想到 教室 里 会 有 一 位 轩 露 头角 的 数 


不 管 怎样 , 我 们 利用 归纳 法 来 证 明 这 一 说 法 是 正确 的 . 有 两 件 事 需 要 验证 : 基 
本 步骤 (基本 情形 ) 和 归纳 步骤 (归纳 情形 ). 现在 开始 吧 ! 


证 明 : ”利用 归纳 法 来 论证 . 
基本 步 又 : P(1) 显然 成 立 , 因为 式 子 两 端 都 等 于 1. 
归纳 步骤 : 假设 P(n) 成 立 , 必须 证 明 P(z+DlH) 成 立 . 根据 归纳 假设 , jx_j k= 
n(n+1) 工 晶 
“起 
n+l 
Dk =1+2+.+n+t+ (n+t+l) 
ka 


二 (1 十 2 十 … 十 n) 十 (n 二 1) 


(n+t+1)(m+1+1) 
2 
因此 , 如 果 P(n) 成 立 , 那么 Pn 十 1) 也 成 立 . 
在 微 积 分 中 , 当 研 究 曲线 下 方 的 面积 时 , 你 可 能 见 过 上 面 的 例子 . 这 个 和 (以 及 
下 一 道 习题 中 的 和 ) 是 在 计算 上 和 与 下 和 时 产生 的 . 
注意 上 面 的 论述 是 如 何 展 开 的 .最 难 的 地 方 是 证 明 “ 如 果 P(n) 成 立 , 那么 
Pn 十 1) 也 成 立 ”. 要 想 证 明 这 一 点 , 我 们 要 观察 P(n + 1) 的 表达 式 , 并 留意 其 中 
隐藏 的 P(n). 然后 , 利用 P(n) 成 立 这 一 假设 来 改写 P(n + 1), 接着 再 进行 一 些 简 
单 的 代数 运算 . 很 多 归纳 过 程 都 是 这 样 的 . 难点 在 于 弄 清楚 如 何 利 用 归纳 假设 来 轻 
松 地 解决 问题 , 但 如 果 想 利用 归纳 法 证 明 , 你 就 要 仔细 留意 这 样 做 的 时 机 . 归纳 法 
的 整个 要 点 是 建立 在 较 小 n 的 结果 上 , 所 以 你 应 该 试 着 找 出 潜伏 在 P(n 二 1) 表达 
习题 A.2.2 ”证 明 : 


: 12 二 n(n 二 DEOntD) 

2 6 
对 于 1a 的 和 , 求 出 一 个 类 似 的 公式 . 一 个 更 勇敢 的 挑战 是 , 对 于 hk4 的 和 , 求 出 一 
个 类 似 的 公式 . (提示 : 从 1 到 nn 的 全 体 整 数 的 d 次 容 之 和 是 一 个 关于 nn 的 d+1 
次 多 项 式 . ) 
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习题 A.2.3 


证 明 : 前 n 个 奇数 之 和 等 于 mn2, 即 


Nn 


>》 (2 一 1 = nn. 


k=1 


上 一 题 中 , 奇数 有 两 种 写法 .我们 选择 将 奇数 写成 2k - 1 是 因为 这 样 可 以 


使 指标 的 取 值 范围 从 1 变 到 n( 如 果 是 前 n 个 奇数 的 话 ). 相反 , 如 果 把 奇数 写成 


2m 十 1, 那么 为 了 得 到 前 n 个 奇数 , m 的 范围 


很 好 , 唯一 的 区 别 是 你 希望 求 和 指标 在 一 个 较 好 的 范围 
希望 在 和 式 中 避免 减 号 . 


A.2.2 整除 


就 要 从 


0 变 到 n 一 1. 这 两 种 写法 都 
内 取 值 ( 即 从 1 到 n), 还 是 


现在 我 们 来 考查 一 个 整除 的 问题 . 这 是 另 一 个 利用 归纳 法 证 明 的 例子 , 但 是 代 
数 运算 和 分 析 却 略 有 不 同 , 这 也 是 我 们 给 出 这 些 论 述 的 原因 . 


个 结论 . 
证 阴 : 
基本 步骤 :; 
归纳 步骤 : 


利 上 
直接 计算 证 明了 P(1) 是 成 立 的 , 即 111+1 二 122-1 = 121 十 12 = 133. 


陈述 是 


归纳 法 来 论证 . 


段 设 P(n) 成 立 , 即 133 可 


“133 可 以 整除 117+1 填 122?-1”. 我 们 利 


以 整除 1171 


Pn 十 1) 成 立 , 或 者 说 133 可 以 整除 11m+D+1 十 122(0 


117%+D+1 十 122(z+IH) 一 1 二 112T+1IT+1I 122m 一 1 十 


由 归纳 假设 可 知 , 133 整除 11"+IH122" 一 1. 


结论 得 证 . 


这 个 证 明 的 困 
144 可 以 写成 133 加 上 11. 这 样 做 的 好 处 是 ， 
巧妙 的 重组 , 我 们 就 可 以 得 到 11"+1 十 1222 一 1. 
常 好 的 主意 (对 包含 12 的 表达 式 
们 想 “ 看 到 ”P(n). 事实 上 , 仔细 


一 11.1L 
一 11.1L 


也 十 工 


n+l 


十 (133 十 


用 归纳 法 来 证 明 这 


并 十 122m"-1， 我 们 必须 证 明 
rD)-1. 但 是 


2 


二 19219201 


人 说 和 


=11(11?41 十 122 7) 十 133 .122" 1. 


因此 , 133 可 以 整除 11+D+IH122(2 二 ID) 一 1 


全 之 处 在 于 , 要 留意 到 133 和 11 都 潜伏 在 144 中 . 具体 地 说 ， 


下 区 外 


也 进行 类 似 的 处 理 )， 
看 看 这 些 论述 并 下 


把 11"+2 


项 要 与 11 相 乘 , 所 以 通过 
改写 成 11.11?+1 是 一 个 非 
这 种 做 法 是 合理 的 , 因为 我 


顾 一 下 整数 之 和 , 可 以 看 到 这 两 


个 证 明 都 要 从 P(n+ 1) 中 找 出 P(n). 许多 归纳 问题 都 要 求 你 找到 潜伏 在 P(n 十 1) 


中 的 P(n). 这 并 不 奇怪 , 因 


由 此 可 以 


让 吕 


Ll 


习题 A.2.4 


HP(n 十 1) 成 立 . 


证 明 : 4 可 以 整除 1 十 327+1. 


为 归纳 论证 的 整个 要 点 就 是 假设 P(n) 成 立 , 然后 证 明 
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习题 A.2.5 ”找到 一 个 正 整 数 a, 使 得 对 于 所 有 的 n, 5 都 可 以 整除 1 十 4o7, 然 
后 证 明 你 的 结论 . 


A.2.3 二 项 式 定理 


最 后 再 给 出 一 个 利用 归纳 法 证 明 的 例子 , 即 二 项 式 定 理 的 证 明 . 在 概率 论 中 ， 
这 个 结果 显然 很 重要 . 我 们 会 经 常 使 用 二 项 式 定理 , 实际 上 , 甚至 还 有 服从 二 项 分 
布 的 随机 变量 ! 
在 陈述 和 证 明 结 果 之 前 , 我 们 先 回忆 一 下 二 项 式 系数 的 定义 和 一 些 性 质 . 


定义 A.2.6 (二 项 式 系 数 ) 设 n 和 上 都 是 整数 ,并且 0<<k<n. 我 们 令 


(Ue 


注意 , 0! = 1. 当天 之 时 , 我 们 设 (”) = 0. 


从 组 合 学 的 角度 来 看 ,，(%) 可 以 解释 为 从 n 个 人 中 无 序 地 选 出 个 人 的 方法 
数 , m! 表示 对 m 个 人 排序 的 方法 数 . 0! = 1 看 起 来 可 能 有 些 奇 怪 , 但 我 们 可 以 把 
它 解 释 为 “由 0 人 构成 的 空 集 , 无 法 对 其 排序 ”. 如 果 忘 记 了 这 些 陈 述 的 证 明 , 请 参 
阅 A.5 节 和 A.6 节 . 
现在 我 们 陈述 二 项 式 定理 


定理 A.2.7 (二 项 式 定理 ) 对 于 所 有 的 正 整 数 n, 我 们 有 


二 项 式 定 理 的 证 明 : ”利用 归纳 法 证 明 . 
基本 步骤 : 当 n= 1 时 , 我 们 有 


1 


> (ew (jz+ (1)s = (z+Y). 


归纳 步骤 : 假设 


0 
利用 引 理 A.5.1 由 z?+1 = (Fe) I yt1 一 (yt 可 知 ， 
( 


(x+) = (z 十 切 (z 十 切 " 


= (+0 (Tarty 
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nN 刀 十 1 一 天 大 NY nk k+l 
(et ee 


三 测 me el Hl-kyk | yntl 
=1 


这 样 就 完成 了 归纳 步骤 , 从 而 得 到 了 定理 . 


和 往常 一 样 , 证 明 中 最 困难 的 部 分 是 卉 清楚 如 何 利 上 


想 是 把 (z 二 JJ)"+1 写成 (z 
设 , 我 们 现在 知道 该 如 何 处 理 


y)(z 十 y)”. 这 种 


来 都 一 样 


颠倒 过 来 . 


做 级 数 展开 时 , 你 会 遇 到 很 多 这 相 
因此 , 我 们 希望 


了 归纳 假设 . 这 里 的 主要 思 
改 法 是 很 “自然 的 ”, 因为 利 
因子 (z 十 幼 ”. 当然 , 也 可 以 把 它 写成 (z 十 力 "(z 十 切 ， 


用 归纳 人 


| 


过 程 是 相似 的 . 我 们 的 目标 几乎 始终 是 : 把 表达 式 改 写成 可 以 利用 归纳 假设 
\ 这 个 问题 最 麻烦 的 部 分 是 必须 调整 求 和 指标 (如 果 继 续 学 习 微 分 方程 , 当 


二 项 式 定 理 还 可 以 用 其 他 方法 来 证 明 , A.6 节 将 利 
斐 波 那 契 数 模 2 

假设 现在 是 10 点 , 大 多 数 人 都 可 以 毫 不 费力 
看 , 我 们 刚才 说 的 是 10 加 上 5 等 于 3 吗 ? 对 
此 ! 时 钟 或 模 运 算 的 思想 在 数论 中 发 挥 着 核心 作用 , 并 
Zz 一 y 可 以 被 n 整除 , 那么 我 们 说 x 与 y 模 nr 同 余 ， 因此 , 15 与 3 模 12 同 余 ， 
因为 12 可 以 整除 15 - 3. 同样 地 , 67 与 7 模 12 同 余 , 因 
67 modulo 12 二 7 或 者 67 =7 mod 12. 

我 们 来 看 一 个 与 辈 波 那 契 数 有 关 的 有 趣 问题 . 回 ， 


A.2.4 


比较 法 来 证 明 二 项 式 定 理 . 


的 练习 ). 比较 好 的 一 个 思路 是 尽量 让 所 有 项 看 起 
2 和 y 的 窜 在 每 个 表达 式 中 都 是 相同 的 , 这 能 帮 我 们 弄 
清楚 该 如 何 移 项 . 通常 情况 下 , 最 好 让 zx 和 y 的 窜 相 同 但 系数 的 指标 不 同 , 而 不 是 


也 说 5 个 小 时 后 是 3 点 ， 想 想 


个 有 12 个 小 时 的 钟 来 说 : 的 确 如 
得 到 了 很 好 地 推广 . 如 果 


加 =0, 记 二 1 并且 


现在 把 这 些 数字 模 2. 不 


为 60 = 5.12 寺 7, 记 作 


ZZ 一下, 辈 波 那 契 数 的 定义 是 


42 二 Fayi 十 人. 前 几 个 斐 波 那 契 数 分 别 是 


0,1,1,2,3,5, 8, 13, 21, 34, 55, 89,... 


如 果 z 是 奇数 , 那么 > 模 2 就 等 于 1. 斐 波 那 契 数 模 2 后 依次 是 


我 们 可 以 从 这 列 数 


持续 下 去 吗 ? 的 确 丸 


看 出 , 如 果 x 是 偶数 ( 即 2 的 倍数 )， 


0,1,1,0,1,1,0,1,1,0,1,1,... 


1 此 , 我 们 可 以 利 上 


那么 z 模 2 等 于 0; 


看 出 一 个 规律 . 它 似乎 在 不 断 重复 0、1 和 1. 这 种 规律 会 一 直 
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斐 波 那 契 数列 模 2 后 是 一 个 重复 序列 0,1,1,0,1,1,... 的 证 明 : ”利用 归纳 法 
论证 . 

基本 步骤 : 前 几 项 的 计算 结果 确实 证 明了 该 序列 从 0,1,1,0,1,1 开始 . 

归纳 步骤 : 斐 波 纳 契 数列 的 定义 属性 是 , 前 两 项 相 加 就 得 到 下 一 项 . 因此 , 考察 
这 一 属性 在 模 2 后 是 否 仍然 成 立 是 很 自然 的 . 换 名 话说, ,4。modulo 2 是 否 等 于 
[CH modulo 2) 十 ( modulo 2)] modulo 2? 具体 地 说 , 我 们 需要 考虑 四 种 情况 . 

e。 若 及 是 偶数 , 玉 _: 是 偶数 , 那么 瓦 + 是 偶数 吗 ? 

。 若 太 是 偶数 , 局 ,_1 是 奇数 , 那么 也 ,4 是 奇数 吗 ? 

。 若 及 是 奇数 , 忆 ,_1 是 偶数 , 那么 ,42 是 奇数 吗 ? 

e。 若 及 是 奇数 , 玉 _1 是 奇数 , 那么 ,42 是 偶数 吗 ? 

这 四 种 说 法 都 是 正确 的 , 我 们 可 以 通 曾 过 简单 的 代数 运算 来 验证 (奇数 加 奇数 是 
偶数 , 奇数 加 偶数 是 偶数 , 偶数 加 偶数 是 偶数 ). 利用 这 一 点 就 可 以 完成 证 明了 . 把 
三 个 相 邻 的 数 看 作 一 组 , 假设 前 有 组 都 是 0,1,1. 我 们 把 它 记 作 


0,1,1,... ,0,1,1. 


在 辈 波 那 契 数列 模 2 后 的 序列 中 , 我 们 看 一 看 接 下 来 的 三 项 . 接 下 来 的 数 是 前 两 个 
数 之 和 模 2, 所 以 这 个 数 是 1 十 1 modulo 2, 即 0. 因此 , 现在 的 序列 就 变 成 了 


= 


0,1,1 1 ,0,1,1,0. 
下 一 项 就 是 1 十 0 modulo 2, 即 1, 这 意味 着 序列 变 成 了 


0,1,1,... ,0,1,1,0,1. 


下 一 项 是 1 modulo 2, 即 1, 于 是 
0.11. ,0,1,1,0,1,1. 


这 正 是 我 们 想 要 证 明 的 一 一 我 们 刚刚 证 明了 , 如 果 前 有 组 都 是 0,1,1, 那么 接 下 来 
的 一 组 也 是 0,1,1. 这 样 就 完成 了 证 明 . 

当 考 察 模 素 数 (2 是 最 小 的 素数 ) 的 有 趣 序列 时 , 我 们 会 看 到 许多 奇妙 的 规律 . 
我 建议 你 上 网 搜索 帕斯卡 三 角形 模 2 的 规律 一 一 最 终 的 规律 会 相当 惊人 ! 


A.2.5 ”错误 的 归纳 法 证 明 


在 看 到 归纳 法 证 明 有 多 么 强大 之 后 ,了解 它 的 一 些 陷阱 是 有 好 处 的 . 如 果 不 够 
小 心 , 那么 你 可 能 会 把 那些 错误 的 论证 误 认 为 是 正确 的 ! 下 面 就 是 一 个 我 很 喜欢 的 
例子 . 

考虑 下 面 的 情况 : 设 P(n) 表示 在 任意 由 mn 人 构成 的 小 组 中 , 所 有 人 的 名 字 都 
是 相同 的 .关于 “P(n) 对 所 有 的 n 均 成 立 ”, 我 们 给 出 一 个 (错误 的 ! ) 归纳 法 
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E 明 . 
证 明 : ” 利 
基本 步骤 : 


归纳 法 来 论证 . 


显然 , 在 任意 


只 有 1 个 人 的 小 组 里 ， 


所 有 人 的 名 字 都 相同 . 


归纳 步骤 : 假设 P(n) 成 立 , 即 在 任意 由 n 人 构成 的 小 组 中 , 所 有 人 的 名 字 都 
相同 . 现在 证 明 P(n 十 也. 考虑 一 个 由 nn 十 1 人 构成 的 小 组 : 


{1,2,3,.… ,nC—1,n,n+t1}. 


前 个 人 构成 了 一 个 n 人 组 ， 
人 的 名 字 与 第 2 个 人 相同 , 也 与 第 3 个 人 相同 
n 个 人 也 可 以 构成 一 个 n 人 组 ,1 
同 . 所 以 , 第 2 个 人 的 名 字 与 第 3 个 人 相同 
个 人 相同 . 综 上 所 述 , 所 有 人 的 名 字 全 都 相同 ! 


都 相 
nn 二 +1 


同样 地 , 最 后 


归纳 假设 可 知 , 他 们 的 名 字 都 相同 . 所 以 , 第 1 个 


哪里 出 


错 了 ? 即使 博 格 无 人 机 也 有 不 同 的 型 号 (《 原 力 觉醒 》 中 的 暴风 兵 也 


什么 . 


很 明显 , 我 们 做 了 
面 的 论述 . 不 要 试图 考察 关于 任意 ”的 证 明 , 我 们 分 析 某 些 具体 的 n, 看 看 会 发 生 


是 , 我 最 喜欢 的 是 JB-007). 所 有 读 过 这 本 书 的 人 都 与 我 的 名 字 相 同 , 这 不 太 可 能 ! 


Se 也 与 第 n 个 人 相同 . 
归纳 假设 可 知 , 他 们 的 名 字 也 


也 与 第 ” 个 人 相同 , 也 与 第 


些 很 


糕 的 事 ; 


青 , 但 哪里 出 错 了 ? 我 们 放 慢 


邯 步 仔细 地 看 看 上 


当 n ==4 时 , 这 个 集合 是 {1,2,3,4,5}, 并 且 包含 4 个 人 的 集合 分 别 是 {1,2,3,4} 


和 {2,3,4,5}. 我 
个 集合 提供 了 必要 的 链接 . 当 n = 3 时 , 集合 就 是 {1,2,3, 各 , 并 且 包 含 3 个 人 的 集 


门 看 到 , 第 2、 


第 3 和 第 4 个 人 同时 属于 这 两 个 集合 , 它们 为 这 两 


合 分 别 是 {1, 2,3} 和 {2,3,4. 同样 地 , 我 们 再 次 找到 同时 包含 在 两 个 集合 中 的 人 ， 
它们 是 必要 的 链接 . 


如 果 n 更 小 呢 ? 我 们 最 


个 人 的 集合 分 别 是 TL} 和 {2}， 


民力 


终 会 得 到 ”= 1， 此 时 这 个 集合 就 是 全 ,2}, 只 包含 1 
它们 没有 公共 元 素 ! 出 
P(n 十 1) 时 , 我 们 假设 了 n 是 “大 的 ”. 没 错 , 在 这 个 问题 中 , 2 是 大 的 . 


错 的 地 方 是 , 当 证 明 P(n) 过 
大 小 这 样 


的 描述 是 相对 的 . 问题 在 于 , 我 们 不 小 心 使 用 了 一 些 只 适用 于 n > 2 的 事实 . 我 们 


很 容易 掉 进 这 个 陷阱 里 


习题 A.2.8 ”与 上 面 的 问题 相似 , 给 出 下 列 陈述 的 错误 证 明 : 整数 的 平方 和 是 
一 个 整数 的 平方 , 即 23 十.… + x2 = x2, 特别 地 , 这 证 明了 全 体 正 整数 都 是 一 个 平 
m= 12 本 
A.3 分 组 证 明 


接 下 来 的 证 明 技巧 与 归纳 法 很 相似 , 我 把 它 称 作 分 组 证 明 . 一 个 很 好 的 例子 是 


微 积分 法 则 , 即 和 的 导数 就 是 导数 的 和 . 大 多 数 教材 都 详 旨 


地 证 明了 两 个 函数 和 的 
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结果 , 却 忽 略 了 对 一 般 情 况 的 证 明 . 小 心 一 些 是 有 必要 的 . 遗憾 的 是 , 无 穷 和 的 导数 

不 一 定 等 于 导数 的 和 . 但 是 , 对 于 有 限 个 可 微 函 数 的 和 , 和 的 导数 就 等 于 导数 的 和 . 
我 们 将 给 出 上 述 结论 的 证 明 , 并 假设 对 于 任意 两 个 可 微 函数 , 它们 和 的 导数 就 

是 它们 的 导数 之 和 . 接 下 来 要 说 的 其 实 是 一 个 归纳 论述 , 但 弄 清楚 如 何 通 过 巧妙 地 

添加 括号 和 分 组 来 证 明 是 值得 高 兴 的 . 

证 明 : ” 设 


g(7)= fi(z) + fo(z)+ f(x) = (fi(2) + fo(7x)) + f3l7) 
是 三 个 可 微 函 数 的 和 . 注意 , 我 们 把 前 两 个 函数 组 合 在 一 起 , 并 用 g 来 表示 两 个 函 
数 之 和 (第 一 个 函数 是 有 i 十 亡 , 第 二 个 函数 是 f3). 对 上 式 求 导 可 得 
dg 
dz 


d 
(2) = [A(e) + halw) + ola) 
d 
= [fi(2) + fa(2)) + f(a)] 
现在 有 两 个 函数 和 的 导数 , 我 们 知道 这 就 是 两 个 导数 的 和 . 3 
Ag) = CA) + fo) + Se 人 
再 次 利用 两 个 函数 和 的 导数 就 是 它们 的 导数 之 和 . 我 们 有 


Vy = dfi dj dfs 
dz dz dz dz 


并 
en 


(2) + = (7), 


(7) 十 


结论 得 证 . 

更 一 般 地 , 这 种 类 型 的 论证 表明 了 任意 有 限 和 的 导数 就 是 导数 的 和 , 这 是 对 微 
积分 中 和 的 求 导 法 则 的 推广 . 遗憾 的 是 , 大 多 数 微 积分 课程 都 忽略 了 这 一 点 , 而 且 
从 来 没有 提醒 过 你 要 小 心 一 些 , 因为 从 技术 上 讲 , 我 们 只 证 明了 两 个 函数 和 的 导数 
就 是 导数 的 和 . 

在 6.2.2 节 和 14.3 节 中 , 我 们 还 会 看 到 这 种 方法 . 在 6.2.2 节 中 , 我 们 会 遇 到 多 
项 式 系 数 ( 即 二 项 式 系数 的 推广 ); 在 14.3 节 中 , 我 们 会 证 明 服 从 正 态 分 布 的 随机 变 
量 之 和 仍然 服从 正 态 分 布 . 


A.4 利用 对 称 性 证 明 


微 积分 教授 喜欢 给 出 无 穷 多 个 相似 的 积分 . 这 里 就 有 一 个 : 求 出 


2 
/ (23 — 1701x° + 24 601) cos? zsin(z3 十 2z)log(z2 + 4)dz. 
= 
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祝 你 找到 一 个 原 函 数 ! 与 实际 问题 相 比 , 课堂 上 的 问题 有 一 个 巨大 的 优势 : 利用 已 


知 方 法 , 你 一 定 可 以 解决 这 个 问题 . 因此 , 这 只 能 利用 微 积分 I 和 工 的 知识 来 解决 . 


这 里 的 “ 穹 门 ” 是, 注意 到 我 们 不 一 定 非 要 寻找 原 函 数 . 没 错 , 如 果 f(z) 是 被 积 函 
数 且 F(z) 是 原 函 数 , 那么 答案 就 是 (2) -Ff(--2). 如 果 知 道 一 个 原 函 数 , 那么 就 
可 以 求 出 积分 值 , 但 即便 不 知道 F, 我 们 也 有 可 能 求 出 积分 值 . 知道 R 是 有 帮助 的 ， 


但 它 并 不 总 是 必要 的 . 有 时 候 , 已 只 对 代数 运算 有 帮助 . (如 果 你 学 过 多 元 微 积 分 ， 
这 就 类 似 于 拉 格 衣 日 乘 数 . 通常 情况 下 , 在 不 知道 拉 格 衣 日 乘 数 时 , 我 们 也 可 以 求 


出 最 大 值 /最 小 值 . 


Wt 


关键 是 要 注意 到 这 不 是 一 个 随意 的 积分 , 它 的 积分 区 域 是 从 -2 到 2， 注意 ， 
这 个 积分 区 域 关 于 0 对 称 ， 另外, 被 积 函 数 是 一 个 关于 0 的 奇 函数 .回忆 一 下 ， 
如 果 f(a 十 xz) = f(a 一 zx), 那么 函数 f(x) 是 一 个 (关于 a 点 的 ) 偶 函 数 ; 如 果 


ja 十 IT) 


a 为 中 心 的 对 称 区 间 上 的 积分 值 等 于 0: 这 是 因为 a 点 某 一 侧 的 结果 被 另 一 侧 的 结 


= 一 f(a 一 7x), 那么 f(x) 就 是 (关于 a 点 的 ) 奇 函 数 . 关于 a 的 奇 函 数 在 以 


果 抵 消 了 . 图 A-1( 上 图 ) 给 出 了 一 个 例子 . 


AAA 
20 000 A \ 


10 000|/ 
\ 


i 
设 f(x) = (zs — 1701z5 + 24 601) cos3 zsin(z3 + 27x)log(z? 十 和. (上 图 ) f(z)( 关 
于 0 的 奇 函 数 ) 下 方 从 -2 到 2 的 区 域 . (下 图 ) jz)2( 关 于 0 的 偶 函 数 ) 下 方 在 对 
称 区 间 [一 2,2] 上 的 区 域 
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对 称 性 的 另 一 个 很 好 的 应 用 是 简化 积分 运算 . 上 面 的 论述 表明 了 , 奇 函 数 在 对 
称 区 间 上 的 积分 值 是 0. 那么 , 关于 a 的 偶 函 数 在 区 间 [a 一 5,a 二 9 上 的 积分 值 是 


多 少 ? 此 时 , 这 个 积分 值 是 被 积 函 数 在 区 间 [wa+ 引 上 积分 值 的 2 倍 , 因为 前 半 前 


分 与 后 半 部 分 的 积分 结果 相同 . 
我 们 把 这 些 结果 记录 下 来 . 


例子 请 参见 图 A-1( 下 图 ). 


利用 对 称 性 一 一 奇 函 数 与 偶 函 
是 一 个 关于 a 的 偶 函 数 . 那么 


数 的 积分 : 设 f(z) 是 一 个 关于 a 的 奇 函 数 , 9(z) 


这 是 对 称 性 最 常见 的 两 个 应 用 , 但 还 有 很 多 利用 对 称 性 的 其 他 情形 , 你 应 该 时 
刻 保持 警惕 . 我 们 会 给 出 另 一 个 利用 对 称 性 的 例子 , 它 在 证 明 伽 马 函 数 的 余 割 恒 等 


式 时 很 有 用 . 下 面 给 出 数学 中 一 个 极其 宝贵 的 结果 : 


是 


这 个 式 子 有 很 多 证 明 方法 , 而 且 它 有 一 个 概率 解释 (例如 , 它 是 一 个 概率 的 倒数 , 这 


个 概率 就 是 两 个 随机 数 互 素 的 
到 证 明 (参见 [SS1,SS2]). 


现在 把 这 个 结果 看 作 已 知 的 , 并 利用 它 推导 出 奇数 平方 的 倒数 和 . 于 是 


既 率 ). 通常 , 这 个 结果 会 在 傅 里 叶 分 析 或 复 分 析 中 得 


,是 得 数 ,是 奇数 
cs 有 1 
全 
2 2 2 
4 (2? A (2n—1) 


Js 
[Ms 
3 
Wg 

3 

| 一 
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这 是 恰当 利用 对 称 性 的 另 一 个 很 好 的 结果 . 关键 在 于 , 要 注意 到 偶数 项 的 和 就 是 总 
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和 的 1/4, 然后 再 把 这 个 结果 代 回 去 . ( 当 回 
样 的 技巧 .) 


顾 微 积分 的 问题 时 , 我 们 会 看 到 更 多 这 


A.5 蛮 力 证 明 


利用 蛮 力 解决 问题 的 方法 有 好 几 种 . 它们 有 一 个 共同 的 特点 : 卷 起 袖子 ， 铅 看 
代数 运算 . 有 时 我 们 很 幸运 , 只 需要 验证 几 项 即 可 , 但 通常 需要 考察 很 多 情形 , 这 样 
就 导致 了 这 种 方法 行 不 通 . 下 面 举 一 个 例子 来 说 明 这 种 方法 . 
回忆 关于 二 项 式 系 数 的 引 理 . 


引 理 A.5.1 对 于 整数 nn 之 及 宕 0, 我 们 有 


引 理 A.5.1 的 证 明 一 一 第 一 部 分 : 第 


个 结果 就 是 , 乘法 是 可 交换 的 : 
n nl nl Nn 
9 NA AR 全 


第 二 个 结果 更 有 趣 . 接 下 来 给 出 一 个 “ 蛮 力 ” 证明. 
引 理 A.5.1 的 证 明 一 一 第 二 部 分 : 我 们 有 


的 上 6 一 元 起 而 二 二 TH Er1) 


E i Bb | 二 | 


时 nl nm—k+i+l+i+k 
(ET 有 | 
nl nn 二 1 


(km Rl En k+l) 
+l)! /n+l 
ED k 上 


蜂 然 上 面 的 论述 是 一 个 证 明 , 但 从 某 种 意义 上 说 , 这 是 一 个 糟糕 的 证 明 . 没 错 ， 
它 的 逻辑 合理 , 所 有 步骤 都 正确 并 且 确实 给 出 了 结果 , 但 在 读 完 之 后 , 你 能 明白 为 
什么 结果 成 立 吗 ? 这 只 是 一 系列 代数 运算 . 能 做 到 这 一 点 的 确 很 好 , 但 在 很 多 问题 
中 , 代数 运算 会 更 加 复杂 , 而 我 们 一 点 也 不 清楚 该 如 何 展开 证 明 . 就 这 个 问题 而 言 ， 
我 们 是 幸运 的 . 它 的 代数 运算 并 不 是 很 糟糕 , 而 且 我 们 很 清楚 该 做 什么 : 找到 公 因 
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子 并 进一步 简化 . 解决 这 个 问题 的 男 一 种 代数 运算 是 清除 分 母 , 然后 简化 . 有 没有 
更 具 启 发 性 的 方法 可 以 解决 这 个 问题 呢 ? 很 幸运 , 答案 是 肯定 的 , 我 们 将 在 下 一 节 
给 出 答案 . 


A.6 通过 比较 或 故事 来 证 明 


我 们 回 到 上 一 节 的 问题 , 证 明 @?) + (i) = ( 叶 ). 我 们 已 经 看 到 了 一 个 没有 
启发 性 的 证 明 , 而 现在 将 看 到 一 个 更 好 的 证 明 , 它 会 强调 到 底 发 生 了 什么 . 这 种 方 
法 ( 即 通 过 比较 来 证 明 ) 的 思路 是 , 用 两 种 不 同 的 方法 来 计算 所 需 的 量 . 由 于 我 们 
计算 的 是 同一 个 量 , 所 以 两 个 表达 式 必须 相等 . 虽然 这 个 想法 很 容易 表述 , 但 实际 
上 很 难 找到 一 个 可 以 给 出 简单 计算 的 观点 . 组 合 问题 是 你 (在 概率 和 数学 方面 ) 遇 
到 的 最 困难 问题 中 的 一 部 分 , 你 常常 需要 依靠 洞察 力 (或 大 量 经 验 ) 来 找到 一 个 考 
察 问题 好 方法 . 

另 一 种 说 法 是 , 我 们 要 用 两 种 不 同 的 方法 来 计算 同一 个 量 . 如 果 用 两 种 不 同 的 
方法 来 计算 同一 个 量 , 那么 这 两 个 答案 必须 一 致 , 许多 恒等式 就 是 这 样 推导 出 来 的 . 
实际 上 , 我 们 在 讲 一 个 故事 , 它 有 一 个 令 人 兴奋 的 结果 : 两 个 主角 其 实 是 一 样 的 . 通 
过 故事 来 证 明 听 起 来 并 不 像 通 过 比较 来 证 明 那 样 具有 学 术 性 , 但 这 确实 是 我 们 正在 
做 的 事情 . 
我 们 看 一 个 简单 的 热身 例子 , 灵感 来 自 于 苏 斯 博士 的 故事 《 史 尼 奇 》. 

对 (?) == (“jk) 的 证 明 : ”想象 一 下 , 现在 有 nn 个 史 尼 奇 , 我 们 想 在 他 们 的 肚 
子 上 贴 一 些 星星 . 如 果 恰 好 及 个 史 尼 奇 可 以 得 到 星星 , 那么 从 n 个 史 尼 奇 中 选 
出 天 个 共有 (%) 种 方法 . 另外 , 我 们 也 可 以 把 这 个 过 程 看 作 排除 n 一 个 得 不 到 星 
星 的 史 尼 奇 , 那么 选 出 n 一 个 得 不 到 星星 的 史 尼 奇 共有 (,”,) 种 方法 . 我 们 从 两 
个 不 同 的 角度 考察 了 同一 件 事 , 所 以 (%) = (,,",). 

我 更 喜欢 这 种 证 明 方法 , 而 不 是 之 前 的 代数 运算 , 因为 它 曾 述 了 真正 发 生 的 事 
情 , 并 解释 了 为 什么 两 个 结果 是 等 价 的 . 

对 (人 +(7)=(") 的 证 明 : ”我 们 要 找到 所 有 这 些 量 的 组 合 学 解释 . 假 
设 有 n 十 1 颗 玻 璃 球 , 其 中 有 n 颗 是 红色 的 , 1 颗 是 蓝 色 的 . 找 出 要 讲 的 故事 是 证 
明 中 最 难 的 部 分 . 随 着 不 断 地 练习 , 这 会 变 得 越 来 越 轻松 , 但 我 们 至 少 要 给 出 这 样 
做 的 理由 . 我 们 有 n 十 1 个 物体 , 所 以 其 中 nn 个 物体 可 能 属于 同一 类 型 , 而 1 个 物 
体 则 属于 其 他 类 型 . 

这 个 故事 还 不 算 太 精 . 在 不 考虑 次 序 的 前 提 下 , 从 n 十 1 颗 玻璃 球 中 取出 天 颗 
共有 (人 ) 种 方法 . 

我 们 还 可 以 怎样 计算 从 n 十 1 颗 玻璃 球 中 取出 大 颗 玻璃 球 的 方法 数 ” 为 了 求 
出 从 n 二 1 颗 玻璃 球 中 无 序 地 取出 大 颗 玻 璃 球 的 方法 数 , 我 们 关注 是 否 取 到 了 蓝 色 
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的 玻璃 球 ， 如 果 没 有 取 到 蓝 色 的 玻璃 球 , 那么 颗 玻 璃 球 一 定 都 是 从 n 颗 红 色 球 
中 取出 的 , 这 有 (") 种 取 法 . 如 果 确 实 取 到 了 蓝 色 玻璃 球 (有 (!) 种 取 法 , 因为 只 有 
1 颗 蓝 色 球 ), 那么 我 们 一 定 从 ” 颗 红色 玻璃 球 中 取出 了 大 -1 颗 , 这 有 (,”) 种 取 
法 . 综 上 所 述 , 两 种 计算 方法 的 结果 肯定 相等 , 所 以 


Nn Nn /n+ 1 
Cl 
这 种 证 明 方 法 更 好 , 因为 它 强 调 了 正在 发 生 的 事情 , 并 给 出 了 代数 运算 的 原因 . 
有 一 种 更 好 的 方式 来 看 待 这 个 计算 . 事实 上 , 这 个 结果 应 该 写成 


Unew 
0/\K 1/\k—1 k 
左 端 的 第 一 个 因子 可 以 看 作 从 1 颗 蓝 色 玻 璃 球 中 取出 0 颗 , 然后 从 n 颗 红 色 玻 璃 
球 中 取出 及 颗 . 第 二 个 因子 则 表示 从 1 颗 蓝 色 玻璃 球 中 取出 1 颗 , 并 从 n 颗 红 色 
玻璃 球 中 取出 1 颗 . 这 两 个 表达 式 是 相等 的 , 因为 (0 = (0) = 1 但 是 我 更 喜欢 
第 二 个 式 子 . 第 二 个 式 子 的 优点 是 , 等 式 两 端 都 具有 对 称 性 . 在 等 式 的 左 端 和 右 端 
“顶部 ”元 素 之 和 都 是 n+ 1 且 “底部 ”元 素 之 和 都 等 于 k. 在 我 看 来 , 这 是 一 种 
清晰 的 划分 方式 , 任何 能 凸显 正在 发 生 什么 的 东西 都 是 好 的 ! 另外 , 这 也 减少 了 我 
们 遗漏 因子 的 机 会 , 因为 在 其 他 问题 中 , 这 些 项 不 可 能 始终 为 1 

为 了 避免 把 问题 搞 而 , 有 必要 讨论 一 下 为 什么 要 让 这 两 项 相 加 , 而 不 是 相 乘 . 
在 概率 论 中 , 我 们 通常 会 把 事件 的 概率 相 乘 . 在 这 里 , 我 们 把 “从 ”+1 颗 玻 璃 球 中 
取出 大 颗 > 这 一 事件 划分 成 了 两 种 互 不 相交 的 可 能 情况 ( 取 到 0 颗 黄色 玻璃 球 , 或 
取 到 1 颗 蓝 色 玻璃 球 ). 对 于 有 限 多 个 互 不 相交 的 集合 , 它们 的 并 的 概率 就 等 于 各 
自 概率 之 和 . 这 迫使 我 们 把 两 个 概率 相 加 ， 

现在 考察 另 一 个 例子 , 证 明 并 (人 (2”) = (2?). 我 们 的 方式 是 用 两 种 不 同 
的 方法 来 计算 同一 个 量 . 实际 上 , 这 意味 着 我 们 要 编 一 个 故事 , 并 且 被 考察 的 量 要 
包含 在 上 述 表达 式 中 . 假设 有 n 名 男生 和 nn 名 女生 都 想 上 同一 门 概率 课 , 但 是 教室 
很 小 , 只 能 容纳 n 个 人 听课 . 从 2n 个 人 (n 名 男生 和 名 女生 ) 中 选 出 上 课 的 个 
人 共有 (7) 种 方法 . 这 是 等 式 的 右 端 , 那么 左 端 是 什么 呢 ? 注意 , 在 任意 个 人 中 ， 
肯定 存在 一 定数 量 的 男生 和 一 定数 量 的 女生 . 如 果 有 上 名 男生 , 那么 一 定 有 nn 一 
名 女生 . 从 nn 名 男生 中 选 出 名 有 (") 种 方法 ; 同样 地 , 从 n 名 女生 中 选 出 n 一 
名 有 (,",) 种 方法 . 因此 , 上 课 的 nn 个 人 中 恰好 及 名 男生 的 选 法 有 (")(,”",) 种 . 
在 选 出 的 n 个 人 中 , 肯定 存在 一 定数 量 的 男生 , 而 且 男 生 的 人 数 会 介 于 0 和 n 之 
间 . 于 是 , 参加 这 门 课 的 学 生 共有 并 () (,”,) 种 选 法 , 这 个 值 一 定 等 于 (2?). 

另外 , 由 于 (,?;) = (), 所 以 上 式 意味 着 并 fo (7%) = (2"). 


Nn 
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习题 A.6.1 找到 一 个 简单 的 公式 , 使 其 包含 三 个 二 项 式 系 数 的 来 积 . 你 得 好 
好 想 想 , 找 一 个 好 故事 . (提示 : 这 里 说 的 并 不 是 (7) ). 

最 后 再 给 出 一 个 例子 . 我 们 看 看 如 何 用 这 种 方法 来 证 明 二 项 式 定 理 . 我 们 要 证 
的 是 


(z 十 四 ”= 王 Sy pn 


k=0 


这 里 有 7 个 因子 , 它们 都 是 zz 十 对 于 每 一 个 因子 , 我 们 既 可 以 选取 x, 也 可 以 选 
取 vy. 不 难看 出 , (z 十 急 ” 是 一 个 关于 z 和 的 多 项 式 , 它 的 项 都 形 如 zzy*.， 有效 
的 序 对 (i,7) 都 有 哪些 ? 这 些 项 的 系数 分 别 是 什么 ? 

现在 有 个 因子 , 对 于 每 一 个 因子 , 我 们 都 可 以 从 z 和 中 任 选 一 个 . 因此 ， 
5 十 天 一 定 等 于 mw 所 以 j 肯定 等 于 n 一 k. ze 的 系数 是 多 少 呢 ? 每 当 从 大 个 因 
子 中 取出 y 时 (这 将 迫 我 们 从 n 一 个 因子 中 取出 z), 我 们 就 得 到 了 一 个 zx?*-*y. 
从 个 因子 中 选 出 上 述 个 因子 共有 多 少 种 方法 ? 这 正 是 二 项 式 系数 的 定义 , 即 
(站), 结论 得 证 . 
我 们 有 必要 看 看 同一 个 结果 的 不 同 证 明 , 尤其 当 它 是 一 个 很 重要 的 结论 时 . 每 
一 种 证 明 都 凸显 了 不 同 的 特征 . 这 些 不 同 的 方法 不 仅 可 以 帮助 你 理解 这 个 定理 , 还 
能 帮助 你 解决 将 来 的 问题 . 很 多 数学 问题 看 起 来 异常 困难 , 这 是 因为 我 们 不 清楚 该 
如 何 着 手 . 你 看 到 的 方法 越 多 , 将 来 解决 问题 的 想法 也 就 越 多 . 


A.7 有 反 证 法 


反 证 法 是 我 最 喜欢 的 证 明 方法 之 一 . 有 时 候 , 与 其 直接 证 明 某 个 结论 成 立 , 倒 
不 如 先 假设 它 不 成 立 , 然后 去 寻找 矛盾 . 我们 来 看 一 个 例子 . 回忆 一 下 , 如 果 某 个 
数 可 以 写成 两 个 整数 的 比值 (分 母 不 为 0), 那么 这 个 数 就 是 有 理 数 ; 否则 , 这 个 数 就 
是 无 理 数 . 

2 的 平方 根 是 个 无 理 数 . 

我 们 假设 它 不 是 无 理 数 , 并 寻找 一 个 矛盾 , 关于 几何 反 证 法 , 请 参阅 [MilMol. 
如 果 它 不 是 无 理 数 , 那 就 是 一 个 有 理 数 , 我 们 有 V2 = p/g, 不 妨 设 p 和 9 互 素 (这 
意味 着 , 任何 大 于 或 等 于 2 的 整数 都 不 能 同时 整除 p 和 q). 如 果 p 和 9 有 一 个 公 
约 数 , 我 们 可 以 把 它 约 掉 , 从 而 得 到 一 个 新 的 分 数 py/q', 其 中 p<p 且 gq <4. 

由 假设 V2 = p/g 可 知 , 29? = 22. 我 们 可 以 断言 2 整除 p. 虽然 这 很 明显 , 但 
我 们 必须 给 出 证 明 . 当 p 是 偶数 时 , 这 一 点 显然 成 立 , 因为 偶数 与 任何 整数 相 乘 得 
到 的 都 仍然 是 偶数 . 当 p 是 奇数 时 , 不 妨 记 p=2m+1. 于 是 22 = 4m2 十 4m 十 1 一 
2(2m2 十 2m) 十 1, 这 个 值 显然 不 能 被 2 整除 . 因此 , p 是 个 偶数 , 记 作 p = 2p1. 那么 
202 = 22 就 变 成 了 2g? = 4p?. 现在 有 2p? = 和 2 按照 类 似 的 方法 进行 论述 , 我 们 可 
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以 得 出 gq 是 个 偶数 . 因此 , p 和 gq 有 一 个 公 因 子 , 这 与 p 和 g 互 素 相 了 矛盾 . 这 个 矛盾 
是 由 假设 “V2 是 有 理 数 ”导致 的 . 因此 假设 不 成 立 , 从 而 有 V2 肯定 是 个 无 理 数 . 

由 于 通过 反例 来 证 明 的 情况 会 经 常 出 现 , 所 以 有 必要 再 考察 一 个 例子 . 这 个 例 
子 会 更 复杂 一 些 , 并 且 利 用 了 分 析 学 和 微 积分 中 的 一 些 结果 . 

设 f(z) 是 定义 在 实 直 线 上 的 连续 函数 . 对 于 任意 的 a < b, 如 果 f(x) 在 区 间 
a, 中 上 的 积分 始终 为 0, 那么 f(x) 就 恒 等 于 0. 

如 果 试 图 直接 证 明 这 一 点 , 我 们 可 能 会 遇 到 一 些 麻 烦 , 因为 已 知 的 是 f(z) 在 区 
闻 上 的 信息 , 但 要 证 明 的 是 f(x) 在 某 一 点 处 的 结论 . 如 果 利用 反 证 法 呢 ? 我 们 假设 
结果 不 成 立 : 所 有 条 件 都 成 立 , 但 存在 一 个 反例 , 即 f 并 非 处 处 为 0. 现在 有 一 些 东 
西 要 处 理 , 我 们 试 着 证 明 , 如 果 存 在 这 样 一 个 函数 , 那么 它 不 可 能 满足 所 有 的 条 件 . 
这 个 矛盾 意味 着 我 们 最 初 假设 存在 一 个 反例 是 错误 的 , 从 而 推出 这 个 定理 成 立 . 

我 们 来 试 一 下 . 假设 有 一 个 连续 函数 , 它 在 任意 区 间 上 的 积分 值 都 为 0, 但 该 
函数 不 恒 等 于 0. 那么 , 一 定 存在 某 个 点 , 记 作 zo, 使 得 该 点 处 的 函数 值 不 为 0. 不 
失 一 般 性 , 不 妨 设 该 函数 在 点 zo 处 是 正 的 (f(xo) < 0 可 以 类 似 地 证 明 ). 

现在 整理 出 从 假设 中 可 以 得 到 的 关于 f 的 所 有 信息 . 我 们 假设 f 是 连续 的 . 于 
是 , 对 于 任意 的 e > 0, 存在 一 个 6, 使 得 当 |z 一 zo < 6 时 , 有 | jz) - /xzo)| < e. 

但 是 , e 是 任意 的 ! 由 f 在 任意 区 间 上 的 积分 值 都 等 于 0 可 知 , [1 f(z)dz = 
0. 不 过 , f(xo) 是 正 的 ! 当 e 充分 小 时 , 由 连续 性 可 知 , f(x) 在 zo 附近 的 值 也 是 正 
的 . 例如 , 令 e < f(zo)/20, 我 们 可 以 找到 一 个 6, 使 得 f(x) > 19f(x0)/20 > 0 

现在 我 们 可 以 得 到 一 个 矛盾 . 在 区 间 [zo 一 6,zo 十 9 上, f(z) > 19f(z0)/20, 但 
已 知 该 区 间 上 的 积分 值 为 0, 因此 利用 微 积 分 的 标准 结果 , 我 们 有 

a zo+9 19f(x 19f (20) .26 
v= | [ fT) | 


Flz)dz < a 
a (2Z) ;20 


其 中 ， 第 一 个 等 式 利用 了 了 在 任意 区 间 上 的 积分 值 都 始终 为 0 这 一 假设 , 但 是 
f(z0)5 > 0, 这 就 给 出 了 一 个 矛盾 ! 上 述 内 容 其 实 就 是 下 面 这 名 话 的 严格 说 法 : 如 
果 连 续 函 数 在 某 一 点 处 是 正 的 , 那么 它 在 该 点 附近 的 一 个 邻 域内 也 是 正 的 , 因此 函 
数 在 该 邻 域内 的 积分 值 不 可 能 为 0. 

在 读 这 个 证 明 的 过 程 中 , 当 看 到 像 19/20 这 样 的 数 时 , 你 可 能 会 扬 起 眉毛 、 感 
到 有 些 疑 惑 . 像 这 样 的 量 在 分 析 中 是 很 常见 的 . 这 里 的 想法 是 , 我 们 要 充分 说 明 函 
数 在 一 个 小 区 间 内 取 正 值 . 这 里 不 一 定 取 19/20, 其 他 的 数 也 同样 有 效 . 


A.8 穷 举 法 (分 治 法 ) 


假设 和 条 件 越 多 , 我 们 知道 的 (详细 ) 定理 和 结果 也 就 越 多 . 通常 情况 下 , 把 证 
明 划 分 成 能 够 涵盖 所 有 可 能 情况 的 若干 种 情形 将 有 助 于 定理 的 证 明 . 我 们 把 这 种 


方法 称 为 分 治 法 . 使 用 这 种 方法 时 必须 涵盖 所 有 的 情况 : 确保 你 考虑 了 所 有 的 可 能 
性 . 例如 , 你 可 能 会 考察 情形 1: 函数 是 连续 的 . 现在 就 可 以 使 用 关于 连续 性 的 所 
有 定理 . 接 下 来 考察 情形 2: 函数 是 不 连续 的 . 此 时 你 就 得 到 了 一 个 特殊 点 , 即 函 
数 的 间断 点 , 并 且 可 以 使 用 与 该 点 相关 的 定理 和 结果 . 这 种 做 法 的 优点 是 , 两 种 | 
形 下 的 结果 都 可 以 使 用 . 它 的 缺点 是 , 现在 必须 给 出 两 个 证 明 . 证 明 更 多 结论 通常 
是 一 种 可 行 的 做 法 , 因为 对 于 每 一 个 结论 , 你 都 可 以 利用 更 多 条 件 . 我 们 来 看 一 个 
例子 . 

设 f 和 g 是 两 个 实 值 函数 ,那么 |f (zx) 十 g(x)| < |f(x)|+|o(z)|. 

如 果 能 证 明 这 个 结论 对 任意 点 z 均 成 立 , 那么 我 们 就 完成 了 证 明 . 不 妨 设 x 是 
固定 值 , 然后 进一步 展开 讨论 . 

情形 1: 假设 f(x) 且 g(x) > 0. 

在 这 个 假设 下 , 我 们 有 

[f(z) + 9(2)| = f(x)+ g(x) = |f(2)| + lg(7))) 

这 就 是 我 们 要 证 明 的 结论 . 

情形 2: 假设 f(x) >0 且 g(x) < 0. 

我 们 想 以 某 种 方式 得 到 f(x) + g(x). 现在 把 两 个 函数 相 加 , 于 是 有 

f(z)+ g(x) < 0+ f(x) = |f(2), 

但 是 , 当 我 们 对 上 式 两 端 同 时 取 绝 对 值 时 , 不 等 式 可 能 会 变 号 (-5 < 4, 但 |-5| > 4. 
因此 , 一 个 标准 技巧 是 将 这 种 情形 再 分 解 成 子 情形 ! 

。 子 情形 A: 假设 0 < f(x) 十 g(x). 那么 由 g(x) < 0 可 知 , f(x) + g(x) < 

f(x). 因此 , 0 << |f(z) 十 g(xz)| < f(z) << |f(z)| 十 |9(z) | 这 就 是 要 证 的 结论 . 
。 子 情形 B: 假设 f(x) 十 g(x) < 0. 那么 由 f(x) >0 可 知 , 0 < 一 1(f(z) 十 
g(z)) < 一 g(x). 因此 , 0 < |f(z) 十 g(z)| < |g(z)| < |f(z)| 二 19g(z)|, 这 束 是 要 

证 的 结论 . 


TA 


这 样 就 完成 了 对 情形 2 的 分 析 . 遗憾 的 是 , 现在 还 没有 结束 , 因为 情形 1 和 情 
形 2 并 没有 涵盖 所 有 可 能 性 . 

情形 3: 假设 f(x) <0 且 g(x) > 0. 

这 与 情形 2 的 证 明 相 似 , 从 本 质 上 看 , 就 是 把 f 和 g 的 角色 互 换 . 

情形 4: 假设 f(x) < 0 且 g(x) < 0. 这 与 情形 1 的 证 明 几 乎 完全 相同 . 
通常 情况 下 , 当 利 用 穷 举 法 进行 证 明 时 , 很 多 情形 实际 上 都 是 相同 的 . 例如 , 在 
上: 面 的 习题 中 , f(x) > g(x) 还 是 g(x) > f(x) 并 不 重要 , 因为 我 们 总 可 以 改变 函数 
的 标签 名 . 正 因 如 此 , 你 会 经 常 看 到 在 证 明 中 使 用 不 失 一 般 性 这 个 短语 , 这 意味 着 
有 些 内 容 在 证 明 中 没有 任何 区 别 , 为 了 更 加 明确 , 我 们 会 假定 一 个 特定 次 序 或 者 给 
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出 一 个 特定 值 . 不 过 要 小 心 , 因为 有 时 不 同 的 名 学 是 很 重要 的 . 例如 , 假设 我 们 正在 
考察 函数 f(x,y) = 22 上 2z402, 那么 只 要 算出 9f/9zx, 就 可 以 通过 交换 x 和 的 
角色 来 了 解 9f/0y. 然而 , 函数 g(z,y) = z2y4 十 x3 却 并 非 如 此 . 在 这 里 ,x 和 y 
的 性 质 有 着 本 质 的 区 别 . 


A.9 举 反 例证 了 明 


学 生 们 最 常 犯 的 错误 之 一 就 是 认为 可 以 通过 例子 来 证 明 某 种 关系 式 是 成 立 的 . 
这 是 错误 的 , 某 些 结论 有 时 成 立 并 不 意味 着 它 始终 成 立 . 我 们 见 过 一 个 很 好 的 例子 
它 就 是 A.2 节 中 的 欧 拉 多 项 式 zz +z 十 44. 当 ne {0,1,… ,39} 时 , 它 始 终 是 个 素 
数 , 但 当 n 取 之 后 的 某 些 值 时 , 这 个 多 项 式 的 值 就 不 是 素数 了 . 

验证 一 种 特殊 情形 并 对 如 何 处 理 一 般 情形 有 一 定 的 直观 了 解 通常 是 有 用 的 , 但 
验证 一 些 例 子 并 不 是 证 明 . 再 举 一 个 例子 , 由 于 16/64 = 1/4 且 19/95 = 1/5, 所 以 
有 人 可 能 会 想 , 当 两 个 两 位 数 相 除 时 , 如 果 对 角 线 上 的 两 个 数 相同 , 那么 这 两 个 数 
就 可 以 消 掉 . 有 疑问 吗 ? 我 们 再 来 验证 一 下 ， 如 果 考 察 49/98, 那么 消 掉 9 就 会 得 
到 4/8, 这 可 以 简化 为 1/2. 可 信 吗 ? 应 该 不 可 信 . 简单 地 看 一 看 12/24. 如 果真 的 
可 以 消 掉 2, 这 个 结果 就 等 于 1/4, 但 它 是 1/2. 当然 , 这 并 不 是 两 位 数 相 除 的 计算 
方法 , 不 过 看 看 这 种 做 法 有 多 少 次 是 有 效 的 非常 有 趣 ! 

然而 , 当 我 们 想 要 反 驭 某 个 陈述 时 , 如 果 能 够 找到 一 个 满足 陈述 必要 条 件 的 例 
子 , 并 且 该 陈述 在 这 个 例子 中 不 成 立 , 那么 我 们 就 已 经 反驳 了 它 , 因为 我 们 已 经 证 
明了 这 个 陈述 并 不 适用 于 所 有 情况 . 这 就 是 举 反例 证 明 的 本 质 . 

习题 A.9.1 满足 下 列 条 件 的 三 位 数 共 有 多 少 对 ? 首先 , 这 两 个 三 位 数 的 中 间 
数字 相等 ; 其 次 , 它们 的 比值 与 去 掉 中 间 数 字 后 的 比值 相等 . 例如 , 数 对 (561,462) 
满足 561/462 = 51/42 = 17/14. 


A.10 通过 推广 例子 来 证 明 


另 一 个 证 明 结果 的 好 方法 是 , 考察 一 种 特殊 情形 , 找 出 其 中 的 规律 , 并 试 着 推 
广 你 所 看 到 的 规律 . 我 们 来 看 看 几 年 前 学 习 乘 法 和 除法 时 的 例子 . 你 应 该 还 记得 被 
3 整除 的 法 则 : 如 果 各 位 上 的 数字 之 和 能 被 3 整除 , 那么 这 个 数 就 能 被 3 整除 . 我 
们 用 下 面 这 些 数 来 验证 这 一 点 : 231(2 十 3 十 1==6 可 以 被 3 整除 , 并 且 231 = 3.77 
也 能 被 3 整除 )、9444(9 十 4 十 4 十 4 二 21 可 以 被 3 整除 , 并 且 9444 = 3.3148 也 能 
被 3 整除 ) 和 1717(1 十 7 十 1 十 7== 16 不 能 被 3 整除 , 并 且 1717 也 不 能 被 3 整除 ). 
虽然 法 则 是 成 立 的 , 但 验证 几 个 例子 并 不 能 构成 证 明 . 我 们 没有 验证 每 一 个 数 , 只 
验证 了 三 个 具体 的 数 . 我 们 必须 证 明 , 对 于 任意 一 个 给 定 的 数 os. …asazalao, 如 果 
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ao 十 ai 十 …: 十 an 可 以 被 3 整除 , 那么 ov. …asazaiao 也 能 被 3 整除 . 
我 们 要 通过 推广 一 个 例子 或 者 某 个 已 知情 形 来 证 明 结 论 . 通常 , 定理 的 表述 方 


式 可 以 指引 你 应 该 做 什么 . 例如 , 我 们 想 要 证 明 被 3 整除 的 性 质 , 而 这 个 定理 就 告 


诉 我 们 被 3 整除 与 各 位 上 的 数字 之 和 有 关 . 所 以 , 我 们 要 问 问 自己 : 当 已 知 这 个 数 


是 on ……asaaalao 时 , 该 如 何 得 到 各 位 上 的 数字 之 和 ? 


2 


例如 , 314 就 是 auzalao, 其 中 aa = 3, al = 1, ao 


4, 


并 且 各 位 上 的 数字 之 和 


就 是 3 十 1 十 4 好 的 , 我 们 可 以 试 着 看 看 其 他 书写 方式 .不 同 的 表述 方式 通常 是 
等 价 的 , 但 它们 具有 不 同 的 性 质 . 各 位 上 的 数字 来 源 于 10 的 方 宕 : 314 可 以 写成 


314= 二 3.100 十 1.10 十 4:1. 


314— (3+1+4) =3.100+1.10+4.1 


因此 , 我 们 看 一 看 如 果 让 314 减 去 它 的 数字 之 和 , 将 会 


A 


发 生 什么 : 


(3 


1 十 4) 


314 一 (3+1+4) =(3:100—3)+(1:10—1)+(4.:1-4) 


314— (3+1+4) = (3).99+ (1):9+ (4)-: 


注意 ,等 式 右 端 显然 可 以 被 3 整除 , 因为 每 一 项 都 乘 以 0 或 9 或 99， 如 果 


0. 


3 十 1 十 4 能 被 3 整除 , 那么 当 把 它 移 到 等 式 右 端 时 , 我 们 发 现 314 就 等 于 一 个 能 被 
3 整除 的 数 ! 如 果 3 十 1 十 4 不 能 被 3 整除 , 那么 当 把 它 移 到 等 式 右 端 时 , 314 就 等 


于 一 个 不 能 被 3 整除 的 数 ! 


只 需要 进行 一 般 化 . 不 难 


现在 我 们 已 经 给 出 了 特殊 情况 下 的 证 明 , 即 对 314 的 证 明 . 首先 证 明 某 种 特殊 
情形 或 某 个 数字 函数 时 的 结论 是 没有 问题 的 , 接 下 来 我 们 | 


看 出 , 当 考 察 wu .aasazaliao = an -107 十 … 十 Qi 101 十 ao:100 时 , 证明 过 程 是 完 


全 一 样 的 . 


A.ll 狄 利克 雷 铝 梨 原 理 


下 面 这 个 看 似 平凡 的 结果 会 出 现在 各 种 各 样 的 问题 中 , 它 是 证 明 许 多 结论 的 有 


力 方法 . 


狄 利克 雷 鸽 梨 原 理 ; 设 41, 42,… , 4, 是 一 组 集合 ， 


并 且 


4 U.…U4n 中 至 少 


有 nn 十 1 个 元 素 , 那么 至 少 有 一 个 A; 包含 了 不 少 于 两 个 元 素 . 


这 个 绪论 之 所 以 被 称 为 馅 巢 原 理 有 如 下 儿 个 原因 . 假设 现在 有 nn 十 1 只 铝 子 和 
n 个 盒子 , 我 们 要 把 每 只 饮 子 放 入 一 个 盒子 里 . 那么 起 码 有 


镁 子 .否则 的 话 , 每 个 盒子 里 最 多 只 有 一 只 铺子 , 又 因为 一 
口 


个 盒子 里 必须 有 两 只 


AAA 


及 n 个 盒子 , 所 以 可 以 


解释 为 最 多 有 m” 只 铝 子 , 那么 至 少 有 一 只 合子 不 见 了 ! 


用 更 数学 化 的 语言 来 描述 ， 


如 果 我 们 想 把 个 物体 放 入 n 个 盒子 中 , 并 且 有 > mw 那么 其 中 一 个 盒子 至 少 包含 
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两 个 物体 . 合集 原理 也 称 为 抽 屠 原理 . 它 在 数论 中 


些 应 用 . 例如 , 在 第 1 章 的 生 
个 人 的 生 


问题 中 , 我 们 看 到 ， 


日 是 在 同一 天 (假设 没有 人 在 2 月 29 日 


先 给 出 一 个 巧妙 的 证 明 , 然后 再 


设 5 是 {1,2,… ,2n} 的 


讨论 


含 两 个 元 素 a 和 上 并 且 a 可 以 整除 0. 
为 此 , 我 们 把 每 个 元 素 se 5 写作 s = 2"so, 其 中 so 是 奇数 . 集合 {1,2,…… ,2n} 


中 一 共有 


这 就 证 明了 a 确实 能 整除 b. 
这 个 问题 的 难点 在 于 弄 清 


n 个 奇数 , 又 因为 集合 5S 
至 少 有 两 个 元 素 a,b 具有 相同 的 奇数 部 分 . 不 失 一 般 性 地 , 不 妨 设 a < 由 
记 作 wa = 2(2m 十 1) 和 5= 27(2m 十 1). 


因为 ac < 


PA 及 n 十 1 个 元 素 , 所 以 


有 很 多 应 用 , 在 概率 论 中 也 有 一 
一 旦 有 366 个 人 , 那么 至 少 有 两 
出 生 ). 下 面 再 看 一 个 例子 , 我 们 


下 如 何 找到 这 种 论述 . 
王 意 一 个 包含 n 十 1 个 元 素 的 子 集 . 那么 9 中 至 少 


包 


铝 梨 原理 可 知 ,5 中 
并 把 它们 
b, 所 以 1 < 刀 从 而 有 了 = 2i7ia, 


楚 如 何 使 尺 


些 应 该 使 用 它 的 线索 . 现在 有 
么 这 个 子 集中 至 少 有 两 个 物体 


够 梨 原 理 . 


堆 物 体 , 我 们 想 证 明 如 果 取 一 个 足够 大 的 子 集 , 屠 


题目 的 措辞 为 我 们 提供 了 一 


具有 某 种 特殊 关系 . 铝 梨 原理 说 的 就 是 当 有 足够 多 的 
定 会 被 迫 产生 菜 些 关系 . 这 是 


物体 时 , 这 些 物体 之 间 


种 很 自然 的 思路 . 


这 里 的 诀 宅 或 困难 之 处 在 于 , 要 意识 到 应 该 把 数 写成 2 的 方 早 与 一 个 奇数 的 


吕 


进而 推出 


和 八 ， 


定 有 两 个 奇数 是 相等 的 . 怎样 才 


能 知道 这 是 我 们 应 该 尝试 的 ? 一 


种 方法 是 取 n 的 特殊 值 , 并 考察 一 些 集合 , 然后 看 看 哪些 元 素 有 


关 的 是 , 试 着 构造 一 些 
mn 十 工 个 对 象 , 所 以 结 i 
的 ”个 奇数 . 如 果 2n 
生意 一 个 都 无 法 整除 上 


规律 . 
现在 回 过 头 来 重新 看 一 看 . 


网 子 , 我 们 明白 了 定理 中 的 n- 


个 元 素 z 添加 到 {n 十 1,n 十 2,. 


k 同 点 .与 此 相 


些 只 包含 ”个 数 的 集合 , 看 看 结论 是 否 成 立 (因为 我 们 没有 取 
从 不 成 立 是 正常 的 ). 经 过 一 番 实 验 后 , 你 可 能 会 看 到 小 于 2m 


在 {1,2,… ,2n} 


FP， 还 有 
个 元 素 ? {ni 十 1,n 十 2,… ,2n} 应 该 是 个 不 错 的 选择 . 这 个 集合 始终 有 n 个 元 素 , 而 


且 不 管 m” 的 值 是 多 少 , 该 集合 中 任意 一 个 数 都 不 可 能 整除 其 


= 8, 那么 这 是 一 个 不 错 的 选择 , 因为 奇数 列 {1,3,5,7} 中 的 
他 数 . 但 是 , 如 果 2n = 10, 那么 我 
且 3 可 以 整除 9， 这 说 明了 考察 较 小 n 的 危险 , 我 们 可 能 会 看 到 一 些 不 会 持久 的 


门 会 得 到 {1, 3,5,7,9}, 并 


哪些 不 错 的 子 集 包 含 了 7 


也 数 . 这 是 一 个 很 好 的 


除 哪个 数 . 如 果 z 较 大 , 比如 n 
中 .， 如果 m/4 


< x < n/2, 那么 4x 就 包含 用 


因为 zx < n, 所 以 z 一 定 能 整除 原 列 表 中 的 某 个 数 . 但 是 , 目 


H 工 不 能 用 一 来 代 蔡 . 如 果 定 理 
… ,2n} 中 , 都 能 得 到 两 个 


成 立 , 那么 把 任意 一 
具有 整除 关系 的 数 . 另外 ， 
前 还 不 清楚 xz 可 以 整 


/2 <z<<n, 那么 2z 就 包含 在 {nn 十 1,n 十 2,… ,2n} 


经 开始 发 挥 作用 了 , 而 这 可 能 是 最 困难 的 


数据 来 指导 我 们 . 从 现在 


方 蝴 . 


该 列表 中 . 
岂 方 . 我 们 要 做 的 是 收集 数据 
全 我 们 必须 要 注意 这 两 个 特殊 值 之 间 相 差 一 个 2 的 


我 们 看 到 2 的 方 寒 已 
利用 这 些 
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A.12 


添加 0 或 乘 以 1 的 证 明 法 


我 把 上 自己 最 喜欢 的 技巧 放 在 了 最 后 : 添加 0 和 乘 以 1. 乍 一 看 , 这 两 种 方法 似 


乎 都 不 会 那么 有 用 . 毕竟 , 如 果 乘 以 1, 我 们 就 回 到 了 开 


这 些 操作 都 不 会 改变 我 介 


] 的 表达 式 . 


的 确 如 此 ! 这 些 方法 之 所 以 强大 

式 的 一 端 , 而 不 考虑 为 一 端 . 我 们 不 能 在 数学 上 区 别 对 街 
的 处 理 方法 . 这 些 方法 能 够 发 挥 
[我 们 不 需要 在 等 式 两 端 使 
和 更 有 局 发 公 


改动 等 


中 一 端 , 另 一 端 必须 采取 同样 
的 形式 , 
的 要 点 是 , 把 代数 表达 式 改写 成 一 利 


以 写成 很 多 种 不 同 


E 是 因为 它们 不 会 改变 任何 东 


始 的 地 方 . 添加 0 也 是 如 此 . 


西 . 我 们 不 能 只 


并 


: 不 管 如 何 处 理 其 


作用 是 因为 1 和 0 可 


相同 的 表达 式 . 这 种 做 法 
进而 提取 出 我 们 熟悉 的 子 


E 的 形式 ， 


表达 式 . 现在 来 看 一 些 例子 . 这 些 例子 是 从 微 积分 中 选 出 来 的 , 但 我 们 真正 需要 的 


是 导数 的 定义 , 即 
f(z) 


(两 种 形式 都 会 用 到 ), 而 


ft) 一 
h—»0 h 了 /一 人 TX’—z 
2 的 导数 是 nz”!. 概率 论 中 的 相关 例子 , 请 参阅 2.5.2 


第 一 个 例子 是 微 积分 中 关于 乘积 求 导 法 则 的 证 明 . 设 上 和 9 都 是 可 微 函数 , 并 


且 令 4(z) = f(z)g(z). 我 们 希望 把 4 的 导数 写成 一 个 关于 f, 了,g 和 9 的 漂亮 
达 式 , 这 是 很 合理 的 . 推测 这 种 关系 的 一 种 很 好 的 方法 是 考察 一 些 特殊 的 例子 . 不 
妨 设 
jz) = 7 且 g(r) = 

那么 

4(z) = z7 所 以 4(z) = 7z5. 
同时 ， 

jz) = 3z2 有 g(z) = 4z3. 


把 f(x), f'(x), 9g(z) ) 结合 起 来 , 从 而 得 到 z5 的 方法 具有 两 种 : 户 (z)g(z) 和 


我 们 就 只 有 这 


7z5, 这 恰好 是 4'(z). 这 


除法 , 还 有 更 多 组 合 方式 , 但 如 果 只 Te 


pe ) 有 趣 的 是 , 如 果 把 这 两 项 相 加 , 会 得 


暗示 了 4'(z) = 


ee 虽然 这 是 


这 个 公式 指 昌 


出 了 证 


和 


二 


/ 2 . 
ey 


明 的 关键 步 又 . 
用 导数 的 定义 和 代 换 可 得 ， 


A(z) 


A(z+h)— A(z) 
i 


到 3z2 .z4 十 Z3.473 
户 (z)g(z) + 六 7z)9 (72). 如 果 考察 更 多 例子 
一 个 很 有 力 的 证 据 , 但 它 并 不 是 证 明 . 然 


©O 
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根据 前 面 的 观察 , 我 们 认为 答案 应 该 是 (zx)g(z) 十 f(z)g'(zx). 现在 可 以 开始 看 到 洪 
伏 在 上 式 中 的 f(zx) 和 g(x) 了 . 假设 最 后 一 项 是 f(x)g(z 十 hh), 而 不 是 f(x)g(zx). 
在 这 种 情况 下 , 上 面 的 极限 就 等 于 f(z)g(x)( 把 g(z 十 站 提取 出 来 , 而 且 它 的 极限 
值 是 g(xz), 剩 下 的 部 分 就 是 f(z) 的 定义 ). 同样 地 , 如 果 第 一 部 分 是 f(z)g(z + 门 ， 
我 们 就 会 得 到 f(x)g'(zx). 我 们 看 到 , 表达 式 正 试 着 趋向 于 正确 的 结果 , 但 还 缺少 需 
要 的 项 . 这 一 点 可 以 通过 添加 0 来 弥补 , 即 添 加 f(z)g(z 十 hh) 一 f(z)g(zx 十 hh). 我 
们 看 看 这 种 做 法 会 带 来 什么 . 在 下 列 代 数 运 算 中 , 我 们 利用 了 和 的 极限 就 是 极限 的 
和 , 以 及 乘积 的 极限 就 是 极限 的 乘积 . 之 所 以 可 以 利用 这 些 结果 是 因为 这 些 极限 均 
存在 . 于 是 


2 f(z+ grth)— fr)grt ht f(r)g(r+t h) — fr)g(z) 
h—0 h 
.f(z+h)— f(z) ? ee g(z+h)— g(r) 
二 站 出 二 有 
= mn T+ Of) ji gz + + im fle) lm SE YO = 9 
= f (2)g(z) + f(x)g (2). 


上 面 的 证 明 有 很 多 不 错 的 特性 . 首先 , 你 应 该 知道 这 个 证 明 的 结果 (至 少 在 学 
过 微 积 分 后 , 你 应 该 知道 这 个 结果 ). 其 次 , 可 以 通过 考察 一 些 特殊 情形 来 推测 答案 
的 形式 . 最 后 , 利用 这 些 特殊 情形 , 可 以 很 自然 地 得 到 证 明 . 在 看 到 诸如 f'(z)g(zx) 
和 f(zx)g'(x) 这 些 项 之 后 , 我 们 就 会 问 自己 : 该 如 何 从 已 知 的 表达 式 中 提取 出 这 些 
项 昵 ? 这 就 引入 了 以 一 种 聪明 的 方式 来 添加 0.， 添加 0 是 没 问题 的 , 因为 这 不 会 
改变 任何 值 . 这 样 做 的 好 处 是 , 我 们 最 终 得 到 了 一 个 新 的 表达 式 , 从 而 可 以 进一步 
简化 . 

对 于 第 二 个 例子 , 我 们 来 看 看 链 式 法 则 , 这 是 微 积分 中 最 令 人 蔷 惯 的 规则 之 一 . 
现在 , 令 B(z) = f(g(x)). 我 们 假设 上 和 9 都 是 可 微 的 , 并 且 fo(z)) 有 定义 . 为 了 
方便 起 见 , 假设 9%(z) 是 一 个 非 0 的 连续 函数 . 这 个 假设 是 不 必要 的 , 但 它 可 以 简 
化 论证 . 我 们 给 出 这 个 假设 是 因为 , 这 里 的 关键 不 是 证 明 微 积分 中 已 有 的 结果 , 而 
是 强调 乘 以 1 的 作用 . 由 于 上 一 个 例子 非常 成 功 , 所 以 为 了 有 一 个 直观 认识 , 我 们 
来 考察 下 列 函数 


同样 地 , 我 们 有 


f(x) = 3z” 和 g(xz) = 473. 
但 要 记 住 , 我 们 要 算 的 是 以 及 产 在 g(x) 处 的 值 , 而 不 是 在 > 处 的 函数 值 , 因此 
相关 量 有 


B'(z) = 12z1, 通过 观察 可 知 12z1 
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jg(z)) = (x)” = 2 
3(z4)? = 37z8 
473， 


1 = 3z3 . 473, 或 者 说 , 此 时 有 B'(x) = 万 (9(z)) 


9 (2). 所 以 , 就 像 乘 积 求 导 法 则 那 相 


我 们 有 一 个 求 导 公式 的 候选 项 . 清楚 目标 对 了 


找到 处 理 表 达 式 的 正确 方法 会 有 很 大 帮助 . 
由 导数 的 定义 可 知 ， 
, im BE+OT BE) in FIE+ hm)) = fg9(7)) 
0 3 有 , 
我 们 正在 寻找 f(g(z)) 和 g(x). 注意 , 分 子 看 起 来 就 像 f 在 点 g(x) 处 的 导数 , 但 
实际 上 并 非 如 此 , 原因 就 在 于 , 这 里 给 出 的 是 了 在 g(z 二 有) 点 处 的 值 , 而 不 是 在 
9(z) 十 h 处 的 值 . 如 果 用 导数 定义 的 第 二 种 形式 呢 ? 在 这 种 情况 下 , xz/ = 9(z 十 六 会 


趋向 于 z, 但 分 母 是 错误 的 . 分 母 应 该 是 z _ g(z) = g(x 十 及 -g(x), 但 实际 上 分 母 


只 是 hh. 为 了 解决 这 个 问题 , 我 们 以 


g(x+h)—g(z) 


g(x+h)—g(z) 


的 形式 乘 以 1, 于 是 有 


1 1 flg(r+h))— f(g(7z)) g(r+h) — 9(7) 
人 pb h z+h)— g(r) 
_ f(g(e + 及 ) f(g(e) g(e+ ge) 
hn»0 9 十 人 一 9(7) h 
ge 二) 一 了 (9(0) 9 十 月 一 ga 
h—=0 g(x+h)—gz) 7 一 0 h 
= f(g9(7)) .9'(7). 
对 于 最 后 几 行 , 我 们 应 该 验证 其 合理 性 . 我 们 要 利用 导数 定义 的 第 二 种 形式 . 因为 
/的 导数 存在 ,所 以 当 xy 以 任意 方式 趋向 于 g(z) 时 ,lims /=f 者 等 于 
jg(z)). 因此 , 当 xz’ 以 xz/ = g(x 十 h) 的 特殊 方式 趋向 于 g(x) 时 ,上述 极限 值 不 变 . 


我 们 妊 
g(7) = g(y) 


g(z 二 各 一 g(z) 
则 , garry=9) 


FE 明 


= 


EE 用 到 了 g'(x) 是 一 
仅 当 z=y. 当 z 
就 是 0/0. 


AI 


个 非 0 的 连续 函数 这 一 假设 ? 这 个 假设 意味 着 ， 
与 y 不 相等 时 , g(y) 和 9g(z) 这 一 点 非常 本 


和 FE 不 
且 女 ， 否 


征 
最 后 , 我 们 对 这 些 技巧 做 
画 辅助 线 来 突 晶 


面 的 关注 . 


个 f 


简单 的 说 明 . 这 有 点 像 在 几何 学 或 三 角 学 中 通 
关系 . 画 这 些 线 并 不 会 改变 什么 , 但 通常 会 引起 我 们 对 问题 革 些 广 


过 
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毫 不 奇怪 , 微 积 分 (更 一 般 地 说 , 实 分 析 ) 工具 在 概率 论 中 发 挥 着 重要 的 作用 . 
当然 , 原因 是 每 个 随机 变量 都 有 一 个 概率 分 布 . 通常 情况 下 , 这 种 分 布 是 连续 甚至 
可 微 的 , 而 我 们 要 研究 的 量 可 以 用 概率 密度 函数 及 其 积分 和 导数 来 表示 . 

我 们 将 快速 回顾 分 析 学 中 的 一 些 关 键 结果 , 并 给 出 如 何 使 用 这 些 结果 的 思路 . 


由 


H 


B.1 介 值 定理 与 中 值 定理 


本 节 涉 及 微 积 分 中 两 个 最 重要 的 定理 : 介 值 定理 和 中 值 定理 .我们 将 通过 介 
值 定理 来 证 明 中 值 定理 , 然后 利用 中 值 定理 来 近似 大 量 概率 . 首先 , 我 们 快速 回顾 
一 些 表示 法 .区 间 {zx : a < x < 0 记 作 (a,b), 称 为 开 区 间 ; 用 [oa 来 表示 
{z :a 过 中 称 为 闭 区 间 . 当然 , 我 们 还 有 半 开 区 间 [a,5) (这 也 是 半 闭 区 间 ). 


定理 B.1.1 [ 介 值 定理 (IVT)] 设 /是 定义 在 区 间 [a,0] 上 的 连续 函数 . 对 于 任 
意 一 个 介 于 f(a) 与 f(b) 之 间 的 数 C, 存在 一 个 ce [a, 趾 , 使 得 f(c) = C. 换 句 
话说 , 连续 函数 所 有 的 中 间 值 都 可 以 取 到 . 


如 果 从 数学 语言 转换 成 普通 语言 , 那么 定理 就 更 清楚 了 , 而 且 相 当 合理 . 为 了 
弄 清楚 这 一 点 , 我 们 考察 下 面 的 例子 . 假设 我 们 正在 开车 , 起 初 以 每 小 时 20 英里 
( 约 32 公里 /小 时 ) 的 速度 行驶 , 之 后 以 每 小 时 100 英里 ( 约 161 公里 /小 时 ) 的 速 
度 行驶 . 因为 这 是 一 个 数学 例子 , 所 以 警察 并 不 会 在 意 . 介 值 定理 断言 , 在 旅行 中 
的 某 个 时 刻 , 我 们 肯定 会 以 每 小 时 50 英里 ( 约 80 | 的 速度 行驶 . 这 应 该 
是 合理 的 , 因为 我 们 假设 汽车 的 速度 是 由 一 个 很 好 的 连续 函数 给 出 的 , 所 以 不 可 能 
从 开始 时 的 慢 速 直接 变 到 最 终 很 快 的 速度 , 而 不 经 过 所 有 中 间 速 度 . 

证 了 明 框 架 : ”我们 利用 分 治 法 来 证 明 . 不 失 一 般 性 , 假设 f(a) < C < f(b). 如 
果 f(a) = C 或 者 f(5) = C, 那么 证 明 就 是 平凡 的 . 很 多 证 明 都 是 这 样 开始 的 一 一 先 
排除 那些 简单 情形 , 然后 转移 到 论证 的 核心 . 

设 zi 是 [ww 中 的 中 点 .如果 f(xz1) = C, 那么 结论 得 证 , 否则 就 有 两 种 情形 : 
f(z1) < C 或 1zi) > C. 如 果 f(z1) < C, 我 们 考察 区 间 [zx1,]; 如 果 f(x1) > C， 
就 考察 区 间 [a, zl]. 

在 任意 一 种 情况 下 , 我 们 都 得 到 了 一 个 新 区 间 , 记 作 [ai1,01], 满足 f(a1) < C < 
f(01), 并 且 区 间 长 度 是 [a,04] 的 一 半 . 我 们 按照 这 种 方式 继续 下 去 , 反复 取 中 点 , 然 
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后 考察 合适 的 半 区 间 . 

例如 , 不 妨 设 函数 f(z) = xz? 二 z++1,a= 二 0,5 二 1 且 C=2. 我 们 有 f(0)=1 
和 f(1) = 3. 不 难看 出 , 中 点 是 1/2 且 f(1/2) = 1.75, 所 以 下 一 个 区 间 是 [ai1,b1] = 
[1/2,4]. 继续 下 去 , 我 们 有 f(1/2) = 1.75, f(1) = 3, 并 且 在 中 点 3/4 处 有 f(3/4) = 
37/16 = 2.3125. 这 意味 着 , 接 下 来 的 区 间 是 [a2, 5b2] = [1/2,3/4. 

简要 概括 一 下 , 我 们 得 到 了 一 系列 区 间 


[a,b D [a1,01] D [ap DO … 


并 且 f(an) < C < f(bn), 每 一 个 a 和 如 要 么 是 上 一 个 区 间 的 端点 , 要 么 是 上 一 
个 区 间 的 中 点 . 如 果 其 中 有 一 个 满足 f(xn) = C, 我 们 就 完成 了 证 明 . 如 果 所 有 中 
点 都 不 满足 , 那么 我 们 就 可 以 无 限 地 划分 下 去 , 从 而 得 到 一 个 点 列 zw € [an, ba]j. 这 


里 需要 进行 严格 的 数学 分 析 (详情 可 以 参阅 [Rud]). 在 实 分 析 课 上 , 你 将 要 证 明 
门 [lan, bn] = [a1,b1] N [az,b2] N las,b3] MN:- 
"= 


就 是 一 个 点 , 记 作 {zo}. 从 直观 上 看 , 这 应 该 是 合理 的 . 在 每 个 阶段 , 我 们 都 有 一 个 
开 区 间 , 当 进 入 下 一 个 阶段 时 , 会 将 它 的 长 度 减 半 . 因此 , 最 后 的 结果 不 可 能 是 一 个 
正 的 长 度 , 但 它 应 该 是 非 空 的 , 因为 


八 


al < a2 < a3 "<b < b> < 0. 


假设 这 些 区 间 的 交集 中 只 有 唯一 的 点 . 由 于 f 是 连续 的 , 并 且 an 一 x0, bn 一 Xo; 
所 以 


lim f(an) = f(z0) = lim (bn 
这 就 是 在 zo 处 连续 的 另 一 种 表述 . 但 是 
f(an) <C< f(bn) 且 f(an) < f(zo) < f(bn). 
这 意味 着 f(x0) = C， 为 什么 ? 它们 都 “压缩 ”到 了 同一 个 值 . 具体 地 说 ， 
lim_;oo f(an) = lim_;,w f (bw) 可知, 这 两 个 极限 值 都 等 于 C, 并 且 也 都 等 于 f(zx0). 


于 是 , 我 们 找到 了 这 个 点 ! (例如 , f(x) =z 十 x 十 1 定义 在 [0,1] 上 , 并 且 C = 2, 那 
么 zo = 辣 :1 = 0.618 034. ) 


定理 B.1.2 [中 值 定理 (MVT)] 设 f(x) 是 定义 在 [a,0] 上 的 可 微 函 数 , 那么 存 
在 一 个 ce (a,0), 使 得 
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我 们 来 解释 一 下 中 值 定理 . 设 f(z) 表示 在 时 刻 z 处 汽车 与 起 点 之 间 的 距离 . 
从 时 刻 a 到 时 刻 5 的 平均 速度 等 于 行驶 距离 了 () -f(a) 除 以 流逝 的 时 间 5 一 a. 
于 fr(z) 表示 时 刻 z 的 瞬时 速度 , 所 以 中 值 定理 说 的 是 , 汽车 在 某 个 中 间 时 刻 的 有 
时 速度 等 于 平均 速度 

例如 , 假设 我 们 的 平均 速度 是 每 小 时 50 英里 (大 约 80 公里 /小 时 )， 如 果 汽车 
的 速度 始终 低 于 50 英里 /小 时 , 那么 平均 速度 就 不 可 能 达到 50 英里 /小 时 ; 同样 地 ， 
如 果 速 度 总 是 大 于 50 英里 /小 时 , 那么 平均 速度 也 不 可 能 是 50 英里 /小 时 ， 因 此 ， 
要 么 汽车 的 速度 始终 保持 在 50 英里 /小 时 (在 这 种 情况 下 , 结论 是 平凡 的 ), 要 么 可 
以 推断 出 汽车 在 某 个 时 刻 的 行驶 速度 低 于 50 英里 /小 时 , 而 在 另 一 时 刻 的 行驶 速度 
高 于 50 英里 /小 时 , 此 时 , 由 介 值 定理 可 得 , 在 某 个 时 刻 , 我 们 必须 以 每 小 时 50 英 
的 速度 行驶 , 因为 这 是 一 个 中 间 速 度 . 实际 上 , 这 就 是 证 明 ; 唯一 的 不 同 是 , 通常 
情况 下 , 你 会 在 数学 书 中 看 到 令 人 印象 深刻 的 数学 符号 , 而 不 是 关于 汽车 的 文字 ! 

为 了 用 熟悉 的 数学 语言 来 证 明 中 值 定理 , 我 们 只 需要 考察 f(a) = J(O = 0 的 
特殊 情形 . 这 就 是 所 谓 的 罗 尔 定理 . 


定理 B.1.3 ( 罗 尔 定理 ) 设 f 是 定义 在 [a,9] 上 的 可 微 函 数 , 并 且 f(a) = f(b) = 
0. 那么 存在 一 个 ce (a,Db), 使 得 f'(c) = 0. 


和 


局 


下 


bm 


ec 


朋 罗 尔 定理 来 证 明 中 值 定理 . (提示 : 考 侍 


ha) = 10) -HD 0) -fl0) 


注意 ， h(a) = f(a) — f(a)=0 且 ji 一 (FoO)- fla) =0. 函数 A 
满足 罗 尔 定理 的 条 件 , 并 


WO= 10 -1-1Y.) 

罗 尔 定理 的 证 明 : ”第 一 步 是 处 理 一 些 特殊 情形 . 我 们 假设 f(a) 和 f(b) 都 
不 为 0 如 果 其 中 一 个 是 0, 那么 很 遗憾 , 我 们 没有 完成 证 明 , 因为 这 个 定理 断言 了 
c 要 严格 地 介 于 a 和 6 之 间 . 然而 , 因为 与 接 下 来 要 处 理 的 情形 类 似 , 我 们 把 这 种 
情形 的 证 明 留 给 读者 独立 完成 

如 果 需 要 的 话 , 可 以 把 f(z) 乘 上 -1 我 们 假设 1/(a) > 0. 为 了 方便 起 见 , 候 
设 f(z) 是 连续 的 . 这 个 假设 可 以 简化 证 明 , 但 并 不 是 必要 的 , 在 阅读 下 面 的 证 明 
时 , 试 着 看 一 看 哪里 用 到 了 的 连续 性 . 

情形 1 一 一 (5) < 0: 因为 f(a) > 0 且 f(b) < 0, 所 以 把 介 值 定理 应 用 于 
(x) 可 得 , 我 们 能 够 取 到 所 有 中 间 值 . 由 于 7(O) < 0 < 7(), 这 意味 着 存在 一 个 
ce (a 加 ,使 得 Po =0. 
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情形 2 一 f(b) > 0: f(a) = f(b) = 0, 并 且 函 数 在 a 和 5 附近 都 是 递增 的 . 
当 xz 非常 接近 于 a 时 , 如 果 x > a, 那么 f(z) > 0. 这 一 点 利用 了 下 面 的 事实 : 


区 一 > 以 Se 和 


因为 f(a) > 0, 所 以 上 述 极限 是 正 的 . 当 z > a 时 , 分 母 是 正 的 , 所 以 分 子 一 定 是 
正 的 . 因此 , 对 于 这 样 的 x, f(z) 肯定 大 于 f(a). 同样 地 , f(b) > 0 意味 着 , 当 z 略 
小 于 5 时 , f(x) < f(b)=0. 

于 是 , 当 z 略 大 于 a 时 , 函数 f(z) 是 正 的 ; 当 z 略 小 于 5 时, 函数 f(x) 是 负 
的 . 如 果 一 阶 导数 始终 为 正 , 那么 f(z) 不 可 能 取 负 值 , 因为 f 在 起 点 a 处 的 值 是 
0. 这 一 点 可 以 通过 再 次 利用 一 阶 导数 的 极限 定义 来 证 明 : 当 (xz) > 0 时 , 函数 f 
在 z 附近 是 递增 的 . 所 以 , 一 阶 导 数 不 可 能 始终 为 正 . 一 定 存在 某 个 点 y € (a,b)， 
使 得 f(y) = 0( 结 论 得 证 ) 或 者 f(y) < 0. 根据 介 值 定理 , 因为 0 介 于 f(a)( 正 的 ) 
与 f(y)( 负 的 ) 之 间 , 所 以 存在 一 个 ce (wy C [a,0], 使 得 f'(c) = 0. 
你 看 到 哪里 用 到 了 f' 的 连续 性 ? 在 调用 介 值 定理 时 , 我 们 用 到 了 这 一 点 . 
使 用 一 个 定理 时 , 都 要 确保 定理 的 所 有 条 件 得 到 满足 . 为 了 利用 IVT, 函数 必须 
连续 的 . 


ulls 
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B.2.1 交换 次 序 : 定理 

为 了 方便 读者 , 我 们 将 给 出 高 等 微 积分 中 几 个 标准 结果 的 精确 陈述 , 而 这 些 结 
果 可 以 应 用 于 很 多 方面 . 因为 变量 替换 定理 非常 重要 , 所 以 它 被 单独 列 为 一 章 ( 参 
见 在 线 补充 章节 ). 

定理 B.2.1 ( 富 比 尼 定 理 ) 设 f 是 一 个 连续 函数 ,并且 


/ | 


那么 
b d d b 
| 1/ head dz = | / fuer dy. 
对 于 
Ni d Ni Mi 
> en 
mn 一 No n=No m=Mo 


有 类 似 的 结论 . 
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对 特殊 情况 的 证 明 , 请 参阅 [BL,VG], 而 [Fol] 给 出 了 一 个 高 等 的 完整 证 明 . 关 
于 无 法 交换 积分 次 序 的 例子 , 请 参阅 习题 B.7.2. 

定理 B.2.2 (交换 微分 与 积分 次 序 ) f(x,t) 是 一 个 连续 函数 , 它 关 于 xz 和 + 的 
偏 导 数 在 区 域 {(z,t) : x € [a,0,t € [c,d]j} 上 是 连续 的 , 其 中 a,b,c,d 都 是 有 限 的 . 
那么 


d re 
i/ f(z,t)dt = CA 


这 个 定理 具有 更 普遍 的 适用 性 . 上 述 区 域 可 以 是 无 限 的 , 但 要 求 函 数 是 衰减 的 . 
关于 该 定理 的 证 明 与 推广 , 请 参阅 [La2]. 

最 后 一 个 结论 有 关 交 换 极限 与 积分 的 次 序 . 我 们 给 出 一 个 最 有 用 的 结果 , 但 它 
的 形式 并 不 是 最 一 般 的 (更 一 般 的 叙述 与 证 明 , 请 参阅 [Fol]). 

定理 B.2.3 (控制 收敛 定理 ) 设 {fi,} 是 一 列 定义 在 及 上 的 分 段 连续 实 值 函 
数 , 并 设 存 在 一 个 非 负 的 分 段 连续 函数 g, 使 得 对 于 所 有 的 mw 均 有 | 户 (zj| < g(x). 
如 果 limn oo 万 (z) 逐 点 收敛 到 一 个 分 段 连续 的 函数 六 那么 


oo 


lim fn(r)dx = 上 im 万 (Z)dz. 


换 名 话说 , 我 们 可 以 交换 极限 与 积分 的 次 序 . 
B.2.2 ”交换 次 序 : 例子 


本 节 的 目的 是 让 你 快速 了 解 如 何 利用 分 析 理 论 来 证 明 某 些 陈 述 的 合理 性 接 
下 来 的 内 容 基 本 上 与 本 书 其 余部 分 无 关 . 因为 重要 的 是 要 和 弄 清楚 该 如 何 证 明 陈 述 的 
合理 性 (这 可 以 减少 偶然 使 用 不 合理 结果 的 机 会 ), 所 以 你 可 以 快速 浏览 或 略 过 以 
下 内 容 . 

一 般 来 说 , 为 了 交换 运算 次 序 , 比如 交换 积分 次 序 或 者 交换 求 和 与 求 导 次 序 , 我 
们 需要 利用 分 析 中 的 一 些 高 级 定理 . 然而 , 在 几何 级 数 中 , 不 利用 高 等 理论 就 可 以 
证 明 交 换 求 和 与 求 导 次 序 的 合理 性 . 原因 在 于 , 如 果 我 们 在 任意 一 个 N 处 截断 几 
何 级 数 


二 1 

Ds (B.1) 
一 :化 

n=0 


那么 几何 级 数 公 式 就 会 给 出 一 个 明确 的 公式 来 表示 其 余 无 穷 多 项 之 和 : 


OO 
>》 om=(1+zZ+22 二 十)+( 人 (zt 二 ZN 十) 
0 


二 1 十 ZX 十 人 十 十 XY 十 一 一 一 
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我 们 证 明了 , 在 几何 级 数 中 , 微分 与 求 和 的 次 序 是 可 以 交换 的 (当然 , 假设 |z| < 
1). (B.1) 式 右 端的 导数 (关于 z 的 导数 ) 就 是 (1 一 z) 悦 . 我 们 想 说 , (B.1) 式 左 端的 


导数 是 
> nxn 1 ; 
n=0 

但 这 要 求 我 们 验证 下 面 这 个 式 子 的 合理 性 


下 面 给 出 验证 这 种 陈述 合理 性 的 一 种 标准 方法 . 当 |z| < 1 时, onz”! 是 收敛 
的 . 如 果 可 以 证 明 , 对 于 任意 的 e> 0, onz"-! 与 (1 一 x) 悦 之 间 的 距离 不 超过 
e 那么 我 们 就 证 明了 交换 的 合理 性 . 

为 此 , 固定 e > 0. 如 上 所 述 , 对 于 每 一 个 N, 我 们 有 


ooe N Ce 
》 zx? 一 》 Xn 》 zr? 
n=0 n=0 


n=N++1 


a 化 
= 


现在 可 以 同时 对 两 端 求 微分 . 由 于 这 里 是 一 个 有 限 和 , 所 以 交换 微分 与 求 和 次 序 是 
合理 的 . 具体 地 说 , 现在 只 有 N +2 项 (其 中 N +1 项 来 自 于 和 式 , 剩 下 的 一 项 是 
守 二 ). 于 是 有 


N 
d ZNT+I d 1 
一 》 人 一 
dz A drz1—Zz dzZ1 一 2 


ee st he 


(1 —2)? (1 —2)? 


1 L 一 


N 
jl (N+ D1-—2)+r Ny 
> (1 7) (1 — x2)2 


由 |z| < 1 可 知 , 对 于 任意 一 个 给 定 的 e > 0, 我 们 可 以 找到 一 个 No, 使 得 对 于 所 有 
的 wW>No, 有 


(V+TIH)( 一 2zZ) 十 Z € 
| < 
同样 地 , 我 们 可 以 找到 一 个 Ni, 使 得 对 于 所 有 的 NN > Ni, 有 


Ce 
> XU 


也 一 入 十 1 
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于 是 , 现在 已 经 证 明了 , 对 于 任意 的 e > 0, 我 们 有 


1 Di NG 


结论 得 证 . 不 去 研究 关于 某 个 具体 x 的 和 , 我 们 可 以 考察 当 ze [a,4] 时 的 情况 , 其 
中 -1<ao 乏 <1 No,Ni 只 与 wb 和 ee 有关. 

习题 B.2.4 ”在 上 面 的 论述 中 , 明确 地 给 出 所 有 的 依赖 关系 . 换 匈 话说 , 当 提 
到 “足够 大 ”时 , 利用 e 将 其 量化 . 

对 于 条 件 收敛 但 不 绝对 收敛 的 级 数 , 我 们 不 能 交换 微分 与 求 和 的 次 序 . 这 意味 
着 , ”an 收敛 , 但 |as| 不 收敛 . 例如 , 考虑 下 列 级 数 


3 2 (B.2) 


当 z= 一 1 时 , 该 级 数 条 件 收敛 , 但 不 绝对 收敛 . 事实 上 , 由 于 
12 x3 0 pn 
a Sn 


所 以 当 z = -1 时 , (B.2) 式 就 是 -log2. 如 果 对 等 式 两 端 同时 微分 , 会 发 生 什么 呢 ? 
此 时 有 


和 Fogd-zl= 区 | 


当 xz € [1,0] 时 , 不 难 算出 , 等 式 左 端的 微分 结果 是 二 但 是 , 如 果 交 换 微 分 与 求 
和 次 序 , 那么 


而 这 个 级 数 在 z = -1 时 并 不 收敛 . (补充 说 明 : 这 个 和 在 1 和 0 之 间 振荡 . 从 某 种 
意义 上 说 , 它 可 以 被 理解 为 1, 也 就 是 寸 . 在 xz = -1 时 的 值 ! ) 
但 是 , 条 件 收敛 但 绝对 发 散 的 级 数 有 时 也 会 有 不 错 的 结果 . 考虑 


Nn 


Oz 
人 mlog7m 
当 z = 一 1 时 , 这 个 级 数 条 件 收敛 , 但 绝对 发 散 . 如 果 交 换 微分 与 求 和 次 序 , 那么 我 


们 会 得 到 
> rn-1 
< logn 


而 这 个 和 在 z = -1 时 确实 收敛 (条 件 收敛 , 不 绝对 收敛 ). 
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B.3 级 数 的 收敛 性 判别 法 


在 微 积分 课 上 , 我 们 学 习 了 用 来 确定 一 个 级 数 是 收敛 还 是 发 散 的 各 种 判别 法 . 
花费 大 量 时 间 来 掌握 这 些 方法 的 原因 有 很 多 , 其 中 之 一 是 你 现在 已 经 完全 准备 好 用 
这 些 方法 来 解决 所 关心 的 问题 了 . 在 第 19 章 中 , 我 们 将 讨论 生成 函数 . 这 些 级 数 
包含 了 大 量 有 关 概 率 分 布 的 信息 . 如 果 这 些 和 收敛 且 可 微 , 那么 简单 的 微分 就 能 给 
出 与 很 多 性 质 相关 的 好 公式 . 遗憾 的 是 , 这 些 无 穷 级 数 并 不 总 是 收敛 的 ， 因此, 我 
们 (最 后 ! ) 看 看 微 积 分 中 各 种 级 数 收敛 性 判别 法 的 应 用 . 
与 之 前 课程 的 结果 一 样 , 如 果 你 不 怎么 使 用 这 些 方法 , 它们 看 起 来 就 会 很 陌生 . 
为 了 保持 完整 性 , 我 们 快速 介绍 一 些 比较 常见 且 功能 强大 的 判别 法 , 并 举例 说 明 它 
们 的 使 用 场景 . 在 此 之 前 , 我 们 先 快速 回顾 一 些 与 级 数 有 关 的 标准 结果 和 符号 . 第 


一 个 是 求 和 符号 


N 
> Qn 二 Q0 十 al 十 :…… 十 QN. 
n=0 


如 果 把 上 界 NN 替换 成 co, 那么 这 个 和 就 变 成 了 ao 十 ai 十 a2 十 …. 对 于 有 限 的 N， 
我 们 有 


N N N 
>》 (an + bn) 二 >》 ant bn 
n=0 we0 各 守信 


如 果 上 式 右 端 的 两 个 和 都 是 有 限 的 , 那么 当 N = co 时 上 式 仍然 成 并 . 然而 , 如 果 这 
两 个 和 是 无 穷 大 , 那么 情况 就 更 复杂 了 . 问题 出 现在 , 其 中 一 个 和 可 能 是 co， 而 另 
一 个 和 是 -co, 但 ce - ce 是 无 定义 的 . (例如 on = 2n 且 b= 一 4n, 以 及 an = 2n 
且 b= 一 n). 如 果 c 是 任意 实数 , 那么 


N N 
> can 一 cy》 Qn 
n=0 = 人 0 


根 值 判别 法 : 假设 lm。 Von| 存在 , 且 该 极限 记 作 p. 那么 , 当 |s| < 1/p 时 ， 
级 数 > 2 0ans” 收敛 ; 当 |s| > 1/p 时 , 该 级 数 发 散 . 如 果 p = 0, 那么 1/p 被 看 
作 无 穷 大 , 这 意味 着 该 级 数 对 所 有 的 s 均 收 敛 . 如 果 |s| = p, 那么 级 数 的 敛 歼 性 
无 法 判定 . 


比值 判别 法 : 假设 lm |an41/an| 存在 , 且 该 极限 记 作 p. 那么 , 当 |s| < 1/p 
时 , 级 数 2 ansn 收敛 ; 当 |s| > 1/p 时 , 该 级 数 发 散 . 如 果 p = 0, 那么 1/p 被 
看 作 无 穷 大 , 这 意味 着 该 级 数 对 所 有 的 s 均 收 敛 . 如 果 |s| = p, 那么 级 数 的 敛 散 
性 无 法 判定 . 
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例如 , 设 on = n2/47. 由 比值 判别 法 可 知 ， 


四 1)2/4n+1 1N21 1 
tl = lim WD )/ = lim (车 ) 


7 一 co Qn Nn—00 n2 /4 


因此 , 当 |s|<4 时 


收敛. 

另外 两 种 比较 常用 的 判别 法 是 比较 判别 法 和 积分 判别 法 . 这 两 种 方法 可 能 会 
更 难 用 一 些 , 因为 你 需要 选择 比较 序列 或 函数 , 但 比值 判别 法 和 根植 判别 法 可 以 直 
接 使 用 (只 需 计 算 极限 ). 尽管 如 此 , 随 着 经 验 的 积累 , 这 些 方法 使 用 起 来 也 会 更 加 
轻松 . 


比较 判别 法 : ” 设 {56%}?21 是 一 个 非 负 序列 ( 即 mm > 0). 假设 级 数 总 obw 收 
敛 , 并 且 {an}%21 是 另 一 个 序列 , 它 满足 |an| < bn 对 所 有 的 n 均 成 立 , 那么 级 
数 oan 也 收敛 . 另外 , 如 果 om > 如 且 ob 发散 ,那么 级 数 > 0an 也 
发 散 . 


积分 判别 法 : 考虑 一 个 非 负 序 列 {an} 呈 1 假设 存在 一 个 函数 f, 使 得 f(n) = an 
并 且 f 是 不 增 的 . 那么 级 数 


> 
"0 
收敛 , 当 且 仅 当 积 4 有 
f(z)dz 


1 


收敛 . 因此 , 如 果 积 分 发 散 , 级 数 也 发 散 . 


注意 : 在 这 两 种 判别 法 中 , 如 果 不 从 n = 0 开始 , 而 是 从 n = NN 开始 , 结论 仍然 成 
立 . 这 是 因为 级 数 的 收敛 性 只 与 无 穷 多 项 有 关 , 所 以 我 们 可 以 放心 地 添加 或 删除 有 
限 多 项 . 

现在 来 看 一 下 级 数 ”1 友 二 元 是 收敛 还 是 发 散 . 我 们 使 用 比较 判别 法 . 使 用 
比较 判别 法 最 困难 的 地 方 在 于 , 要 和 弄 清楚 这 个 序列 应 该 与 什么 样 的 序列 进行 比较 . 
如 果 认 为 它 会 收敛 , 我 们 应 该 找 一 个 收敛 的 级 数 , 并 且 该 级 数 的 每 一 项 都 要 更 大 ; 如 
果 认 为 它 会 发 散 , 就 应 该 找 一 个 每 一 项 都 较 小 且 发 散 的 级 数 . 当 n 较 大 时 , 2” 大 于 
Vn, 所 以 分 母 看 起 来 基本 上 就 是 2". 因此 , 我 们 希望 这 个 级 数 是 收敛 的 , 并 把 它 与 
几何 级 数 5 = 1/2” 进行 比较 . 我 们 正式 地 写 出 代数 表达 式 , 由 于 2” + Vn > 2”， 
所 以 
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1 1 
0 < TT 所 < 
因此 , 由 比较 判别 法 可 知 , 这 个 级 数 收敛 . 0 
数 的 问题 . 考虑 


Ooe 


1 n 

a) > 27 + Vn 
按照 类 似 的 论证 方法 , 我 们 可 以 把 这 个 级 数 与 几何 级 数 1(s/2)” 进 行 比较 . 当 
|s| <2 时 , 5 21(s/2)” Se 因此 , 当 |s| < 2 时 , G(s) 收敛 
现在 考察 = 5; 其 中 p>0.9 ei 该 级 数 会 收敛 或 发 散 ? 我 
们 知道 学 二 是 发 散 的 . 遗憾 的 是 , 当 n 较 大 时 , 二 5 二 ,所 以 比较 判别 法 不 
可 用 . 如 果 想 通过 比较 判别 法 来 证 明 级 数 发 散 , 我 们 必须 找到 一 个 较 小 且 发 散 的 级 
数 , 而 不 是 更 大 的 级 数 . 就 这 个 问题 而 言 , 我 们 很 难 找到 一 个 合适 的 级 数 来 进行 比 
较 . 遗憾 的 是 , 比值 判别 法 和 根 值 判别 法 也 无 法 提供 任何 有 用 的 信息 (两 者 的 极限 
都 是 1). 现在 只 能 试 着 利用 积分 判别 法 . 
第 一 步 是 找到 一 个 严格 减少 的 函数 f(x), 使 得 当 n 较 大 时 , 如 果 x = n, 那么 
f (2) = 二 二 和 看 我 们 刚才 写 下 的 内 容 , 你 应 该 能 够 想到 用 在 积分 判别 法 中 的 
函数 : f(z) = 二. 在 这 类 问题 中 , 直接 把 ” 蔡 换 成 x 是 很 常见 的 做 法 . 因此 , 级 
数 的 敛 散 性 完全 取决 于 积分 


1 
zBIG TIn? 7 
的 敛 散 性 ， 这 里 的 BIG 是 为 了 说 明 积分 下 限 并 不 重要 一 重要 的 是 无 穷 远 处 的 
性 质 . 接 下 来 要 做 变量 替换 . 这 是 一 种 很 自然 的 做 法 , 原因 是 mr 的 导数 是 1/z. 看 
一 看 被 积 函数 , 它 包含 了 一 个 1/z, 所 以 我 们 显然 要 做 变量 蔡 换 . 令 = ln z, 于 是 
du = dz/z, 那么 上 述 积分 就 变 成 了 


[ u ?du. 
u=ln(BIG) 


如 果 p 冯 1, 那么 wu-? 的 积分 是 二 ; 如 果 p= 1 那么 wu-? 的 积分 就 是 nu. 因此 ， 
当 p > 1 时 , 上 述 积分 收敛 ; 当 p < 1 时 , 该 积分 发 散 . 
个 结果 可 以 转化 为 与 生成 函数 


Ooe 


1 Nn 
(0 
| 


相关 的 陈述 . 对 于 任意 的 p, 在 经 过 一 些 处 理 之 后 , 你 可 以 证 明 : 当 |s| < 1 时 , 这 个 
和 收敛 ; 当 |s| > 1 时 , 这 个 和 发 散 . 
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B.4 大 O 表示 法 


丁 将 引入 一 种 表示 法 , 方便 我 们 在 某 些 参数 趋向 于 无 穷 大 时 , 可 以 轻松 地 比 
较 两 个 量 . 如 果 这 个 定义 看 起 来 很 有 技术 性 , 那么 有 一 个 自然 的 原因 : 它 确实 如 此 ! 
这 个 定义 的 整个 要 点 是 , 在 极限 情况 下 仔细 地 讨论 和 比较 两 个 表达 式 . 重点 是 绕 过 
那些 笼统 的 论述 , 避免 使 用 诸如 “显然 ”和 “当然 ”这 样 的 表达 . 当 需 要 进行 严格 比 
较 时 , 这 种 表示 法 会 贯穿 于 整个 分 析 理 论 . 


作为 一 个 引导 性 的 例子 , 想 想 标准 正 态 分 布 和 标准 指数 分 布 . 第 一 个 分 布 的 概 
率 密度 函数 是 - 坊 ;exp(z?/2), 而 第 二 个 分 布 的 概率 密度 函数 是 exp(-z)， 因 此 ， 


当 z 一 oo 时 , 标准 正 态 分 布 的 衰减 速度 “显然 ” 比 标准 指数 分 布 的 衰减 速度 要 快 
我 们 现在 要 做 的 是 指明 标准 正 态 分 布 的 衰减 速度 快 了 多 少 , 并 避免 使 用 “显然 ”这 
个 词 


定义 B.4.1 (大 O 表示 法 ) 4(z) = 0(B(7x)), 读 作 “4(z) 是 B(z) 的 阶 (或 大 
O)”. 这 意味 着 存在 一 个 C > 0 和 一 个 zo, 使 得 当 xz > zo 时 ,有 |A(z)| < CB(z). 
它 也 可 以 写成 4(z) < B(z) 或 者 B(z) > 4(z). 


我 们 来 分 析 一 下 . 关于 C 的 表述 没什么 问题 , 它 只 是 说 稍 后 会 出 现 一 个 正 的 
常数 .常数 zo 是 为 了 确定 我 们 的 讨论 范围 . 我 们 说 的 是 , 从 某 个 点 开始 会 发 生 什 
么 . 对 于 “小 ”z, 我 们 没有 给 出 任何 说 明 , 只 知道 当 x 一 co 时 会 发 生 什 么 . 具体 地 
说 , 对 于 任意 一 个 较 大 的 zx, |4(z)| 不 会 超过 CB(z). C 的 真实 值 通常 并 不 重要 , 重 
要 的 是 函数 随 着 x 增加 (或 衰减 )， 此外, 在 很 多 问题 中 , 不 等 式 对 每 个 x 都 成 立 ， 
因此 我 们 不 需要 担心 zo. 


有 时 候 , 当 x 一 0 时 , 我 们 会 使 用 大 O 表示 法 , 而 不 是 z 一 co. 在 这 种 情况 下 ， 
定义 可 以 修改 成 存在 一 个 zo, 使 得 当 |z| < zo 时 , 有 |A(z)| < CB(z). 


在 图 B-1 中 , 我 们 画 出 了 4(z) = 2010logx 和 B(x) = z2， 对 于 较 小 的 x 
值 , 我 们 看 到 4(z) 会 更 大 , 然而 随 着 x 的 增加 , 最 终 可 以 看 到 B(z) 更 大 . 原因 是 
22 的 增长 速度 比 log zx 快 , 所 以 在 极限 情况 下 , z2 将 超越 log x. 然而 , 我 们 不 能 说 
2010logz < z2, 因为 当 z 较 小 时 ， 这 个 不 等 式 不 成 立 . 它 只 适用 于 较 大 的 z(z > 100 
就 是 够 了 ). 在 许 多 问题 中 , 我 们 只 关心 当 输入 参数 趋向 于 无 穷 大 时 的 比较 结果 , 因 
此 这 样 的 限制 没有 问题 . 

大 0 表示 法 是 处 理 低 阶 项 的 一 种 便利 方法 . 例如 , 如 果 有 F(x)=x5 十 O(z2)， 
那么 这 意味 着 当 x 趋向 于 无 穷 大 时 , F(x) 的 主要 部 分 与 z5 的 增长 速度 一 样 ， 
正 (或 误差 ) 项 不 超过 z2 的 某 个 常数 倍 . 


V 
到 
eo 

SR 


B.4 大 O 表 示 法 683 


40 000 
30 000 
20 000 


10 000 一 一 


50 100 150 200 
图 B-1 2010logz 和 z2 的 对 比 


毫 不 奇怪 , 在 泰勒 级 数 展开 式 中 , 这 种 表示 法 经 常 出 现 . 考虑 cosz 的 泰勒 级 数 
展开 式 : 


2 (一 DJ)"z2m 可 x2 x4 
0 2 og 


令 ze[-m 可 并 在 0 附近 取 值 . 我 们 来 看 一 看 , 不 同形 式 的 泰 勤 级 数 展开 式 逼 近 


cosz 的 效果 有 多 好 . 例如 ， 


忆 


有 
cosz = 1 一 二 十 O(z9)， 


2 
我 们 断言 这 个 式 子 适用 于 所 有 的 x, 原因 是 这 里 的 近似 误差 为 
zx4 re zx3 
I 
可 以 通过 删除 所 有 的 负 号 来 对 其 进行 简单 的 约束 , 因此 误差 最 多 是 
zt 26 8 
PT 


这 个 和 有 多 大 ? 记 住 , 我 们 想 在 0 附近 取 zx, 所 以 x 的 方 窜 越 高 , 值 就 越 小 . 因此 ， 
误差 的 “主要 ”部 分 来 自 于 z4/4. 把 这 一 项 提取 出 来 , 我 们 看 到 误差 不 会 超过 


4 


化 
a 
当 x 接近 于 0 时 , 显然 有 |z| < 1/2, 因此 我 们 可 以 利用 几何 级 数 公 式 来 计算 这 个 和 
(比值 就 是 z2). 注意 , 当 |z| = 1/2 时 , 和 取 到 最 大 值 (这 是 最 糟糕 的 情况 ). 我 们 最 
终 看 到 误差 至 多 为 


24 1 
41—x2 


如 果 假 设 |z| < 1/2, 则 有 
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x2 

COS 7 (4 5 ) 
换 名 话说, 如果 |z| < 1/2, 那么 在 逼近 cosz 的 二 阶 泰勒 级 数 展开 式 中 , 误差 项 会 
非常 小 , 因为 它 不 会 超过 zx4/18. 例如 , 令 x = 0.1, 那么 cos(0.1) 约 等 于 1 一 0 _ 
0.995, 其 中 误差 项 不 大 于 0.14/18 s 5.5556 . 10-6. cos(0.1) 的 真实 值 (十 位 小 数 ) 为 
0.995 004 165, 这 意味 着 实际 误差 大 约 是 4.165 28 . 10-6. 注意 , 实际 误差 小 于 理论 
上 界 , 所 以 我 们 应 该 已 经 正确 地 完成 了 代数 运算 ! 

这 里 有 两 个 非常 重要 的 关系 : 对 于 任意 固定 的 x, 当 z 一 co 时 , zr 的 增长 速度 
比 ez 的 增长 速度 慢 ; 对 于 任意 一 个 c> 0, 当 z 一 co 时 , logz 的 增长 速度 比 ze 的 
增长 速度 慢 . 有 许多 方法 可 以 证 明 这 些 关 系 . 为 了 强调 证 明 方 法 , 我 们 来 证 明 第 一 
个 关系 , 并 把 第 二 个 关系 留 给 读者 完成 . 我 们 考察 当 x 一 co 时 z” 和 ez. 现在 要 证 
明 的 是 zr = O(e”). 当 ” 是 负数 时 , 这 个 结果 显然 成 立 , 所 以 只 需要 考察 + > 0 时 
的 情况 . 如 果 ” 恰好 是 一 个 整数 , 我 们 就 可 以 利用 洛 必 达 法 则 : 


4 24 7x4 


< Bs; 
34 18 


CR A rr-l 7r(r 1)z" 2 .7! 
lim — = lim = lim OO lim = 0. 
Z 一 co GZ Z 一 co ©T 2 一 co eT 人 一 co GZ 


为 什么 要 假设 > 是 整数 ? 这 只 是 为 了 在 应 用 洛 必 达 法 则 时 看 起 来 更 加 整洁 . 如果 
7 是 一 个 整数 , 那么 在 应 用 了 洛 必 达 法 则 之 后 , 与 分 子 的 乘积 就 是 rl. 当 ” 为 正 
整数 时 , 因为 上 述 极限 值 为 0, 所 以 由 定义 可 知 , 存在 一 个 zo, 使 得 当 x > zo 时 ， 
27/jer < 1/2, 从 而 有 z7 = O(e”*). 对 于 一 般 的 ” 我 们 也 可 以 使 用 洛 必 达 法 则 (分 母 
上 最 终 会 得 到 一 个 x 的 方 容 ) 或 者 注意 到 zx” < zl"1, 其 中 [r] 是 不 小 于 7 的 最 小 


由 于 很 多 问题 都 会 用 到 xz" = O(e*), 所 以 我 们 再 给 出 一 个 证 明 . 为 了 方便 起 见 ， 
不 妨 设 7 是 个 整数 . 由 ez 的 泰勒 级 数 展开 式 可 知 , ez > z"+t1/(7 十 1)!( 这 是 因为 我 
们 只 保留 了 一 项 ). 如 果 x > (7 十 1)!, 那么 


zr+l 


i 


B.5 指数 函数 


本 市 将 研究 数 e 的 一 些 基 本 性 质 . 有 很 多 方法 可 以 定义 6。, 即 自然 对 数 的 底数 . 
从 微 积分 的 角度 来 说 , 最 便捷 的 方法 是 利用 无 穷 级 数 来 定义 : 
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把 上 述 级 数 的 部 分 和 记 作 


mm 


1 
Sm 二 De 


n=0 
不 难看 出 , e 就 是 收敛 序列 sm 的 极限 . 这 种 表示 法 是 用 来 分 析 e 本 质 的 主要 工具 
之 一 . 关于 指数 函数 的 一 个 很 好 的 应 用 , 请 参阅 习题 20.11.38, 我 们 将 展示 如 何 利 用 
它 来 推导 三 角 恒 等 式 . 现在 推广 上 述 内 容 并 写 出 指数 函数 . 


指数 函数 : 设 x 是 任意 一 个 实数 (或 复数 ). 指数 函数 e*( 出 于 排版 目的 , 当 参 数 
较 复 杂 时 , 指数 函数 有 时 会 写成 exp(z)) 被 定义 为 


Nn 


2 
er = 》 一 . 
nl 


n=0 


另外 ,ez*+y = erey. 


我 们 把 上 面 的 式 子 称 为 指数 函数 ! 如 前 所 述 , 由 于 排版 问题 , 我 们 经 常 使 用 exp 
符号 . 例如 , exp(z2/2) 读 起 来 要 比 e-” /2 更 容易 些 , 也 好 过 更 糟糕 的 e- 到 1 

用 来 定义 指数 函数 的 级 数 收 敛 地 非常 快 , 所 以 任何 判别 法 几乎 都 有 效 . 我 们 考 
虑 易于 使 用 的 比值 判别 法 . 于 是 


lim lantil | 


也 一 CO lan,| 
区 /十 ID 
ace /ml 


| 
3 


= lim = 


因此 , 该 级 数 对 于 所 有 的 x 都 是 收敛 的 . 

这 种 表示 很 有 启发 性 , 目的 是 让 你 思考 如 何 把 数 自 乘 到 某 次 容 . 我 们 把 er 读 
作 e 自 乘 到 x 次 容 . 如 果 被 问 到 erey 是 多 少 , 你 应 该 马上 回答 ez+y, 但 重要 的 是 要 
注意 到 这 一 点 并 不 明显 , 需要 证 明 ! 从 技术 角度 上 讲 , er, ey 和 er*+y 是 三 个 不 同 的 
无 限 和 , 我 们 必须 证 明 前 两 个 的 乘积 等 于 第 三 个 . 当然 , 如 果 这 不 成 立 , 那么 我 们 的 
表示 法 就 糟糕 透 了 (没有 其 他 词语 可 以 恰当 地 描述 它 有 多 恐怖 ). 不 幸 的 是 , 数学 中 
也 会 偶尔 出 现 不 好 的 表示 法 . 我 一 直 很 讨厌 csc 是 1/ sin, 而 不 是 1/ cos. 

证 明 erey = ez+y 是 二 项 式 定理 的 一 个 很 好 的 应 用 . 我 们 有 


ezey = 一 一 一 . 


注意 , 在 求 和 符号 中 , 我 们 使 用 了 两 个 不 同 的 字母 . 重复 使 用 同一 个 字母 是 很 常见 
的 错误 , 我 们 不 能 也 不 应 该 这 样 做 . 使 用 相同 字母 是 错误 的 原因 在 于 , 这 里 有 两 个 
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和 , 并 且 每 个 和 都 有 一 个 用 于 求 和 的 虚拟 变量 (与 积分 中 的 虚拟 变量 相似 )， 例 如 ， 
考虑 


(LT+T2+3). (1 二 22 上 35 = 84. 
如 果 使 用 相同 的 虚拟 变量 , 就 可 能 导致 下 面 的 错误 计算 : 


3 3 3 
2 2 = > n= 13+2+3 = 36. 


每 个 和 都 用 不 同 的 字母 来 表示 , 这 样 可 以 降低 我 们 犯 这 种 错误 的 概率 . 

回 到 关于 erey 的 分 析 , 不 难看 出 , 我 们 得 到 了 一 个 各 项 形 如 加 各 的 和 式 , 其 
中 m,n > 0. 我 们 现在 要 做 的 是 , 收集 那些 > 的 方 守 与 y 的 方 守 之 和 等 于 常数 的 
项 . 换 句 话说 , 对 于 一 个 给 定 的 天 > 0, 我 们 考察 满足 m 十 n= 的 全 体 数 对 (m,n). 
现在 还 要 引入 一 个 虚拟 变量 . 不 妨 设 1 是 x 的 方 寒 . 如 果 x 的 方 宕 加 上 y 的 方 震 
等 于 k, 这 就 意味 着 只 要 x 的 方 时 等 于 1, y 的 方 窜 就 等 于 一 1. 另外 ,1 的 取 值 范 
围 是 从 0 到 (因为 z 与 y 的 方 窜 都 是 非 负 整数 ). 综 上 所 述 , 我 们 有 


现在 我 们 要 从 中 找 出 一 些 规律 . 注意 , 这 个 分 母 看 起 来 很 像 二 项 式 系数 : 它 
(六 的 分 母 . 这 提醒 我 们 要 乘 以 1 (更 多 例子 , 请 参阅 A.12 节 ), 此 时 1 = oe. 
注意 , 分 母 暗示 了 要 利用 二 项 式 系数 . 具体 地 说 , 即 (7) = zn 各 1 
的 形式 乘 以 1, 就 可 以 看 到 二 项 式 系数 : 


利用 二 项 式 定 理 , 我 们 把 上 面 关于 ! 的 和 替换 成 了 (zx 十 y)', 并 利用 级 数 展开 式 把 关 
于 R 的 和 替换 成 了 ez+y， 

在 上 面 的 讨论 中 , 最 重要 的 是 我 们 的 直觉 是 正确 的 , 并 且 表 示 法 是 恰当 的 . 另 
外 , 同样 值得 注意 的 是 乘 以 1 的 作用 . 这 是 最 难 掌握 的 数学 技巧 之 一 , 但 也 是 最 重 
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要 的 技巧 之 一 . 我 们 总 是 可 以 乘 以 1( 或 者 做 一 些 类 似 的 事情 , 即 添加 0), 关键 是 要 
找到 一 种 可 以 给 出 更 简单 表达 式 的 正确 方法 . 

ez 的 另 一 种 定义 也 会 出 现在 概率 论 中 . 你 可 能 还 记得 出 现在 复 利 问题 中 的 e"， 
金钱 会 即时 按照 复 利 计 算 . 这 个 定义 对 于 证 明 某 些 独立 随机 变量 之 和 的 中 心 极限 定 
理 非 常 有 用 . 


ez 的 另 一 种 定义 是 


en = lim (1+7) . 
TN 


nN— O00 


一 个 很 好 的 练习 是 , 证 明 这 个 定义 与 级 数 展开 式 的 定义 是 一 致 的 . 
如 果 没 有 谈 到 e 的 导数 , 那么 对 e 的 介绍 就 是 不 完整 的 . 利用 级 数 展开 式 ， 
个 很 自然 的 尝试 是 逐 项 微分 , 即 


当然 , 我 们 需要 证 明 交 换 求 和 与 求 导 次 序 的 合理 性 . 这 个 证 明 通 常会 在 高 等 分 析 课 
中 给 出 的 . 

不 使 用 计算 器 和 计算 机 , 判断 哪个 数 更 大 : er 还 是 xe. (提示 : 一 种 方法 是 研究 
函数 zl*.， 让 两 个 数 同时 取 er 次 方 根 , 从 而 把 问题 简化 成 比较 el 和 rz 的 大 
小 . 然后 利用 微 积 分 找到 最 大 值 . ) 另外 , 还 可 以 考察 f(x) = ez - ze, 并 试 着 证 明 当 
2 >e 时 , f(x) > 0. 然而 , 要 分 析 所 有 的 临界 点 是 很 困难 的 . 更 简单 的 做 法 是 , 考察 
g(z) = e*/* 一 x 并 证 明 当 x > e 时 , g(z) > 0. 


B.6 柯 西 - 施 瓦 兹 不 等 式 的 证 明 


最 后 一 个 分 析 学 结果 是 柯 西 - 施 瓦 效 不 等 式 ， 它 对 确定 某 些 积分 的 上 界 非常 


有 用 


引 理 B.6.1 ( 柯 西 - 施 瓦 兹 不 等 式 ) 对 于 复 值 函数 f 和 9， 


fv < (feas) 2 (fp) 3 


柯 西 - 施 瓦 兹 不 等 式 的 证 明 : ”为 了 简化 表示 , 假设 上/ 和 9 都 是 非 负 函 数 . 在 
这 个 假设 下 , 我 们 可 以 很 好 地 处 理 |f| 和 |g|. 如 果 (B.3) 式 右 端的 任意 一 个 积分 是 
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0 或 无 穷 大 , 那么 我 们 可 以 马上 给 出 证 明 . 因此 , 不 妨 设 这 两 个 积分 都 是 非 0 且 有 
限 的 . 设 
/oo jz)g(z)dz 


hs) = (0) -Me),  — pa 


因为 fs Atzj2dz > 0, 所 以 
wo oe 


站 、 f(z janae + go)ae 
Eee (ee) 


> (x)?2dz 六 9g(z)2dz 


je (Ee) 


2 g(x)2dz 
由 此 可 得 ( 
[Eo f(z)g(z 
a (2) Ss 人 a 
也 就 是 


tn foo ) < f(x) dz g(x)*dz. 


对 上 式 两 端 同 时 取 平 方 根 就 得 到 了 结论 . 

这 个 证 明 利 用 了 数学 中 最 重要 的 恒等式 之 一 : 如 果 w 是 一 个 实数 , 那么 w? > 0. 
巧妙 之 处 在 于 对 v 的 选择 . 对 于 那些 喜欢 挑战 的 读者 , 想 一 想 为 什么 这 个 选择 可 行 . 
这 为 什么 是 一 个 好 的 选择 ? 一 个 好 的 出 发 点 是 确定 柯 西 - 施 瓦 兹 不 等 式 在 什么 情况 
下 是 个 等 式 . 


B.7 习 题 


习题 B.7.1 ”在 罗 尔 定理 的 证 明 中 , 我 们 假设 (a) 和 了 (5) 都 不 为 0. 当 其 中 一 个 等 于 0 时 ， 
证 明 该 结论 
习题 B.7.2 ”积分 次 序 并 不 是 始终 可 以 交换 的 . 为 了 简单 起 见 , 我 们 给 出 一 个 序列 mm, 它 满 
是, (Damn) ,Damn). 当 mm>0 时 , 设 
1 若 n==m 
amn = 4 —1 若 n= 二 m+ 二 1 
0 其 他 . 


证 


明 : 


习题 B.7.3 


上 


二 有 


(其 中 e 是 一 个 固定 的 了 


种 不 同 的 求 和 次 序 会 给 出 不 同 的 答案 


为 了 证 明 交换 求 导 与 求 和 次 序 的 合 


(N+1)(1—z)+z oN 


(原因 是 各 项 的 绝对 值 之 和 是 发 散 的 ). 


里 性 , 我 们 要 找到 一 个 No, 使 得 当 N > No 


€ 


(1 — 2)? 


< 
2 


E 整 数 ). 找 出 一 个 有 效 的 No( 你 的 答案 应 该 与 e 有 关 ). 


习题 B.7.4 ”考虑 控制 收敛 定理 . 证 明 : 如 果 不 存 在 非 负 的 分 段 连 续 函 数 g, 使 得 |f,(z)| < 
g(x) 对 所 有 nn 均 成 立 , 那么 该 定理 的 结论 不 一 定 成 立 . 
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这 里 的 
之 , 我 们 
多 个 元 素 的 


A 人 已 
可 能 会 导 


致 一 些 3 


日 


将 看 到 , 并 非 所 有 的 无 穷 大 都 是 等 价 


人 


集合 , 其 中 一 个 包含 的 元 素 可 能 比 
次 的 无 穷 大 . 最 小 的 称 为 可 数 (整数 的 个 数 就 是 可 数 
(实数 的 个 数 就 是 不 可 数 的 ). 可 数 无 穷 大 在 数学 中 


E 常 奇怪 的 必 


况 ， 季 运 的 是 


不 难 


处 理 ， 


标 是 在 概率 论 入 门 课 中 引入 足够 的 可 数 集 与 不 可 数 集 理论 . 简 而 言 
的 ! 令 人 惊讶 的 是 , 对 于 两 个 有 无 穷 
男 一 个 的 少 . 我 们 将 证 明 
的 ), 比 可 数 更 大 的 叫 作 不 可 数 
日 不 可 数 无 穷 大 就 


存在 不 同 层 


LH 


现在 


概率 中 上 


的 通 篆 


(当然 , 这 3 


这 是 一 个 非常 丰富 


不 完全 是 巧合 ， 


庞大 


试 在 如 此 短 


一 定 的 了 解 ， 


暂 的 介 引 
因为 当 介 


市 
| 入 


兰 (例子 请 


现 帮 


{0, 1, 2,3,.… 


{p/g :p,q € 


顾 一 下 我 人 


2Z,g #0} 


子 集 . 符号 


都 是 无 穷 大 , 但 我 们 稍 


乙 来 自 于 德 


中 


} 是 整数 集 也 = {… 
的 子 集 , 有 理 数 集 是 实数 全 


多 


这 个 
无 限 集 时 会 


参阅 8.4 节 ). 


C.1 


] 多 年 来 遇 到 的 标准 
es 0 


产生 一 些微 妙 的 东西 


要 对 概率 论 


因为 这 些 是 我 们 可 以 处 理 的 无 穷 大 ! ) 
的 主题 , 在 数学 上 有 许 
蛙 论 阐述 透彻 . 我 们 


集合 的 大 小 
无 限 集 有 下 列 包含 关系 : 


和 EE 
) 击 妇 


二 


是 可 数 无 穷 大 . 


jj 途 , 我 们 不 可 能 也 不 会 尝 
中 的 可 数 与 不 可 数 有 
些 机 种 


I 来 避免 误 


二 


然 数 集 N = 


上 的 子 介 让 


整数 售 


语 Zahl( 数 ), 而 Q 来 


后 会 看 到 有 些 集合 比 其 


从 表面 


上 看 , 谈论 


二 二 


难道 它 介 


大 的 不 同 


能 并 不 成 立 . 例如 , 考虑 闭 
ee 
意义 上 说 , 它们 的 大 小 是 相同 
y 二 7X/2 € [0,1] 与 之 匹配 . 
我 们 都 可 以 在 4 中 找到 
一 个 元 素 . 从 这 个 了 


中 的 同 


量化 无 穷 大 似乎 很 奇怪 
不 应 该 有 相同 的 大 小 吗 ? 令 人 惊讶 的 
尺寸 做 很 自然 的 划分 

从 男 一 个 角度 看 , 这 也 许 并 不 奇怪 
bP 么 B 不 应 该 更 大 吗 ? 对 有 限 集 来 说 , 这 是 正确 的 ; 但 
[0,1] 和 B= 


区 间 4 = 


是 有 理 数 集 Q = 
攻 及 的 子 集 , 实数 集 是 复数 集 C 的 


于 quotient( 商 ). 虽然 所 有 这 些 集合 
也 集合 更 大 . 


三 | 


伏案 


上 且 不 


候 ; 口 椒 代 


. 如 果 4 c B, 并 且 


已 中 


包含 一 


. 当 两 个 集合 都 包含 无 穷 多 个 元 素 时 ， 
定 的 , 我 们 可 以 对 无 穷 


些 不 属于 4 


[0,2]. 


全 唱 


大 , 因为 第 一 个 集 


未 口 碟 加 一 


宕 全 


< 


利用 这 种 匹配 方法 ， 


的 , 因为 每 个 元 素 ze [0,2 


不 难看 出 , 名 


都 可 


对 无 限 集 而 言 , 这 
正如 我 们 所 说 的 , 在 某 
集合 的 真子 集 . 但 从 另 一 种 
以 找到 唯 
全 定 B 中 人 


的 元 素 
E 意 一 个 元 素 ， 


唯 


个 元 素 , 并 | 


日 B 中 两 个 不 同 的 元 素 不 可 能 对 应 到 4 
9 度 来 看 , 4 和 B 的 大 小 似乎 是 相同 的 ! 


C.1 


集合 的 大 小 
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快速 说 明 一 些 必要 的 符号 . 对 于 函数 f : 4 一 B, 如 果 | 
Zz 二 yy, 那么 了 就 是 一 对 一 的 (或 单 射 ); 对 于 伯 
使 得 f(a) = 。b, 那么 f 就 是 映 上 的 ( 即 满 射 ). 
射 . 通俗 地 说 , 如 果 不 同 的 输入 给 出 了 不 同 的 输出 , 那么 


耐 的 例子 给 出 了 一 种 比较 四 


潜在 的 输出 都 存在 相应 的 输入 , 那么 函 数 就 是 满 射 . 

考虑 函数 f: R 一 民 , 其 定义 为 f(z) = 2. 不 是 双 射 , 因为 A-D = f(1), 或 
者 更 一 般 地 , f( 一 xz) = f(z). 由 于 这 个 函数 不 是 单 射 , 所 以 它 不 可 能 是 双 射 . 但 不 要 
绝望 ， Be A 个 单 射 . 考虑 函数 g : [0, V2) 一 [0,2), 其 定 
义 为 g(x) = z2. 我 们 来 证 明 这 个 函数 是 双 射 . 如 果 g(x) = g(), 那么 zw? = 刀 , 这 
意味 着 x = ty. 因为 9 只 在 [0, V2) 上 有 定义 , 所 以 输入 不 可 能 是 负 的 . 因此 , 当 
22 = 多 时 , 我 们 知道 > 和 wy 肯定 都 是 非 负 的 , 这 表明 了 只 有 唯一 解 . 接 下 来 只 需要 
证 明 9 是 满 射 , 也 就 是 说 , [0,2) 中 每 一 个 元 素 都 是 [0, V2) 中 某 个 元 素 的 象 . 对 于 


给 定 的 ye [0,2), 令 z= vy, 于 是 g(x) = 
一 个 集合 的 大 小 , 以 及 两 个 集合 什么 时 候 大 小 相同 . 


我 们 现在 来 定义 


个 集合 的 方法 . 在 将 其 列 为 定义 之 前 , 我 们 首先 


f(z) 


Vy =Y. 


= f(y) 可 以 推出 
E 意 给 定 的 be B, 如 果 存 在 一 个 ae 4 

既是 一 对 一 又 是 映 上 的 函数 称 为 双 
函数 是 一 对 一 的 ; 如 果 每 个 


如 果 集 合 4 与 B 之 间 存 在 一 个 双 射 f: 4 一 B, 那么 说 4 和 B 有 相同 的 基数 


( 即 相 同 的 大 小 ), 并 把 相同 的 基数 记 作 |4| = |B|. 如 果 4 包含 有 限 多 个 元 素 (不 
妨 设 有 n 个 元 素 ), 那么 存在 一 个 从 4 到 {1,… ,n} 的 双 射 . 我 们 说 4 是 有 限 
的 , 并 且 |4|=n< oo. 

两 个 有 限 集 有 相同 的 基数 , 当 且 仅 当 它 们 的 元 素 个 数 相 同 ; 证 明 这 一 点 . 这 与 
我 们 的 直觉 相符 - 如 果 4 是 B 的 真子 集 (这 意味 着 , B 中 包含 了 一 些 不 属于 4 的 
元 素 ) 并 且 它 们 都 是 有 限 集 , 那么 |4| < | 了 |. 

如 果 集合 4 与 B 之 间 存在 两 个 映 上 函数 / : 4 一 B 和 g: B 一 4, 那么 


14|= 


1B|; 证 明 i 
最 后 给 出 一 点 说 明 . 对 集合 4 来 说 , 如 果 存 在 一 
但 不 是 映 上 的 , 那么 集合 4 就 被 称 作 无 限 的 . 换 句 计 


玄 结论 . 


根据 这 个 定义 , 不 难看 出 集合 N 和 2 都 是 无 限 集 . 


无 限 集 的 定义 似乎 有 点 奇怪 
= {alyaa,…: 
么 ? 假设 f: 4 一 4 是 映 上 的 , 但 遗漏 J 
映射 到 a. 


不 妨 设 A 


都 不 可 能 


.我 介 
,Qn}， 定义 在 4 上 的 一 对 一 映射 不 可 能 


于 了 是 一 对 


到 不 同 的 元 素 . 


但 是 , 由 


个 元 素 . 


馅 梨 原 理 ( 亦 和 和 


尔 狄 利克 和 雷 抽 居 原理 , 参阅 A.11 5 


个 映射 了: 4 一 4 是 一 对 一 ， 
说, 无限 集中 有 无 穷 多 个 元 素 . 


] 看 一 些 例子 . 假设 4 中 存在 有 限 多 个 元 素 ， 
` 是 映 上 的 . 为 什 
某 个 元 素 . 不 失 一 般 性 , 不 妨 设 任何 元 素 
的 , 所 以 qi1,a2,… ,an 中 的 每 一 个 都 会 映射 
于 没有 元 素 映射 到 av, 所 以 这 n 个 元 素 只 能 映射 到 n 一 1 
节 ) 可 知 ， 


定 有 2 个 ai 


四 
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映射 到 了 同一 个 元 素 , 因为 现在 有 7 个 对 象 映射 到 了 n 一 1 个 对 象 上 . 这 与 上 是 
对 一 的 假设 相 了 矛盾 , 因为 有 两 个 元 素 被 映射 到 了 相同 的 元 素 . 我 们 刚刚 证 明了 , 任 
意 一 个 有 限 集 都 不 可 能 使 到 自身 的 映射 是 单 射 但 不 是 映 上 的 . 因此 , 如 果 集 合 4 到 
自身 存在 一 个 一 对 一 但 不 是 映 上 的 映射 , 那么 4 一 定 是 无 限 的 ! 
对 于 上 述 情况 , 我 们 给 出 一 个 例子 . 设 4 是 自然 数 集 , 那么 4 = {0,1,2,…}. 
把 映射 f: 4 一 4 定义 为 f(n) = n 十 1. 显然 , 这 个 映射 是 一 对 一 的 , 但 不 是 映 上 
的 , 因为 没有 数字 映射 到 0. 

下 面 这 个 例子 乍 一 看 似乎 很 奇怪 . 正 偶数 集 与 正 整数 集 的 基数 相同 . 我 们 使 用 
的 双 射 是 f(n) = m/2. 

我 们 仔细 看 看 这 个 问题 , 并 弄 清楚 它 为 何如 此 令 人 惊讶 . 设 En 是 由 不 大 于 N 
的 全 体 正 偶数 构成 的 集合 . 小 于 2M 的 正 偶数 所 占 的 比例 为 M/2M = 1/2, 但 正 偶 
数 集 与 N 有 相同 的 基数 . 设 Sy 是 由 小 于 或 等 于 NN 的 全 体 完全 平方 数 构成 的 集 
合 , 那么 按照 类 似 的 方法 , 小 于 或 等 于 N 的 完全 平方 数 所 占 的 比例 约 为 1/VN. 当 
N 一 co 时 , 这 个 值 趋向 于 0. 因此 , 从 某 种 意义 上 说 , 偶数 要 比 完全 平方 数 多 很 多 ， 
但 从 另 一 种 意义 上 说 , 这 两 个 集合 的 大 小 相同 . 


C.2 可 数 集 
现在 终于 可 以 定义 可 数 集 了 . 这 些 集合 是 尺寸 “最 小 的 ”无 限 集 . 


如 果 集合 4 与 整数 集 Z 之 间 存 在 一 个 双 射 (或 者 4 与 自然 数 集 N 之 间 存 在 一 
个 双 射 , 稍 后 我 们 将 证 明 这 一 点 ), 那么 4 就 是 可 数 的 . 如 果 集 合 4 是 有 限 或 可 
数 的 , 那么 4 就 是 至 多 可 数 的 . 如 果 4 不 是 至 多 可 数 的 , 那么 4 就 是 不 可 数 的 . 


7IT 


我 们 经 常用 简单 集合 来 构建 复杂 集合 . 构造 集合 最 重要 的 方法 之 一 是 利用 笠 
儿 乘 积 . 


如 果 4 和 B 都 是 集合 , 那么 第 卡 儿 乘积 4 x B 就 是 {(a,b) :a € A,be B}. 


如 果 不 了 解 笛 卡 儿 乘 积 , 你 就 无 法 学 习 多 元 微 积分 ， 我 们 可 以 把 两 个 变量 的 
实 值 函数 写成 f : R? 一 及， 这 意味 着 我 们 把 两 个 实数 作为 输入 并 输出 一 个 实数 . 
R2 一 及 x 民 代表 和 输入. 对 于 向 量 值 函 数 , 我 们 可 以 记 作 五: R3 -了 3. 
现在 我 们 给 出 几 个 常见 的 可 数 集 ， 考 虑 正 整数 集 W = {1,2,3,…} 把 了 : 
W 一 N 定义 为 f(n) = n 一 1. 因为 f 是 一 个 双 射 , 所 以 这 两 个 集合 具有 相同 的 基 
数 . 现在 看 一 看 整数 集 马 = {… ,一 1,0,1,…}. 当即 关 0 时 , 令 f(n)=2n; 当 n<0 
时 , 令 f(n) = 一 (2n 一 1). 不 难看 出 , f 是 从 ZZ 到 的 双 射 , 所 以 这 两 个 集合 的 大 小 
也 相同 . 


bl 
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下 面 是 一 个 不 错 的 练习 . 证 明 : 如 果 f: 4 一 B 是 一 个 双 射 ,并 且 g: B 一 C 
也 是 一 个 双 射 , 那么 h : 4 一 C 是 一 个 双 射 , 其 中 h(a) = g(f(a))( 因 此 ,hn ==gof 
是 9 与 f 的 复合 函数 ). 这 意味 着 基数 满足 一 些 非 常理 想 的 性 质 : 如 果 4 和 B 的 
大 小 相同 , 并 且 B 和 C 的 大 小 相同 , 那么 4 和 C 的 大 小 相同 . 虽然 这 个 结果 应 该 
是 成 立 的 , 但 它 确实 需要 一 个 证 明 . 利用 上 述 练习 以 及 复合 函数 的 性 质 , 我 们 可 以 
得 到 下 面 这 个 非常 重要 的 结论 . 


要 想 证 明 5 是 一 个 可 数 集 , 只 需要 找到 从 5 到 W, N 或 者 Z 的 一 个 双 射 . 


为 了 继续 展开 论述 , 我 们 需要 下 列 直观 可 信 的 结果 (相关 证 明 , 请 参阅 任何 一 
本 关于 集合 论 的 教材 , 比如 [HJ]). 


定理 C.2.1 设 A,B 和 0C 是 三 个 集合 . 
(1) 如 果 4 C 了 ,那么 |4| < |B|. 
(2) 如 果 f: 4 一 C 是 一 个 一 对 一 函数 (不 一 定 是 映 上 的 ), 那么 |4| 和 1C| 
此 外 , 如 果 CC A, 那么 |4| = Cl 
(3) ( 康 托 尔 - 伯 恩 斯 坦 定理 ) 如 果 |4| < 1B| 且 |B|<<|4|, 那么 |4|=|B|. 


现在 我 们 来 说 明 如 何 使 用 一 些 可 数 集 来 生成 更 多 的 可 数 集 . 


定理 C.2.2 如果 A 和 B 都 是 可 数 集 , 那么 AUB 和 A x B 也 都 是 可 数 集 . 


证 明 : ”由 于 4 和 B 都 是 可 数 集 , 所 以 存在 两 个 双 射 ff: N 一 A4 和 g: N 一 上 B. 
于 是 , 我 们 可 以 把 4 和 B 的 元 素 记 作 


4 二 {Qo0, a1, 02, 43,.**} 


B= {bo, b1, b2, bs, Er 小 


假设 A4Nn B 是 空 集 . 把 函数 hh: N 一 AUB 定义 为 h(2n) = an 和 h(2n 寺 1) = by. 
因为 h 是 从 N 到 4AUB 的 双 射 ,这 就 证 明了 AUB 是 个 可 数 集 . 我 们 把 A4NnB 非 
空 的 情形 留 给 读者 自己 完成 . 

为 了 证 明 4 x B 是 可 数 集 , 考虑 函数 h : N 一 A x B, 其 定义 如 下 (参见 图 


bo), h(3) = (a1,01),h(4) = (a0,b1) 
bo), h(6) (az2,0b1), h(7) i (a2,b2), h(8) = (a1, 02), h(9) 二 (ao, b2), 


等 等 . 例如 , 到 了 第 n 步 时 , 有 


Q1， 
(a2， 


oe 
Pn 
7 

| 
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h(n2+1) = (anbo),jPn2 十 2) = (an,bn_1),…- 
jn2 + nt+1) = (an,bn), h(n? +n+2) = (ob 本) 
h((n+1)) = (ao,bn). 


个 


人 
电 
?9 
由 
1 
1 
1 


14 13 


7 12 


人 
| 
| 
| 

由 
| 
| 
| 
| 
e@ 
一 一 一 -9 一 一 一 一 人 -一 一 一 -9 一 一 一 一 


图 C-1 A xB 是 可 数 集 


我 们 考察 的 是 第 一 象限 (包括 坐标 轴 在 内 ) 的 所 有 整数 对 (aj,).， 上 述 函 数 h 从 
(0,0) 开始 , 然后 在 第 一 象限 内 移动 , 每 个 数 对 经 过 且 只 经 过 1 次 , 通过 上 下 移动 ， 
然后 回 到 x 轴 重 新 开始 . 
上 述 定理 最 重要 的 结果 之 一 是 , 从 可 数 集 开 始 , 最 后 要 得 到 一 个 不 可 数 集 非 常 


困难 ! 


推论 C.2.3” 设 {hijien 是 一 组 集合 , 对 于 任意 的 ie N, 4i 都 是 可 数 的 . 那么 
对 于 任意 的 n, A1U:…U 4, 和 Al x.… x A 都 是 可 数 集 , 最 后 一 个 集合 是 由 全 
体 即 元 组 (al ,an) 构成 的 集合 , 其 中 ai € hi. 另外 , UY%0A; 是 个 可 数 集 . 如 
果 每 个 A; 都 是 至 多 可 数 的 , 那么 UP204; 也 是 至 多 可 数 的 . 


接 下 来 证 明 一 个 非常 重要 且 有 用 的 事实 . 


定理 C.2.4 ”有理数 集 也 是 可 数 集 ! 


证 明 : ”我 们 又 得 到 了 一 个 可 能 让 人 感到 尺 讶 的 结果 . 毕竟 , 在 任意 两 个 整数 
之 间 存 在 无 穷 多 个 有 理 数 , 但 我 们 现在 说 这 两 个 集合 的 大 小 是 一 样 的 ! 
显然 , 由 于 整数 集 是 有 理 数 集 的 一 个 真子 集 , 所 以 有 理 数 集 至 少 与 整数 集 的 大 
小 相同 . 我 们 要 做 的 就 是 证 明 有 理 数 集 是 至 多 可 数 的 , 因为 有 理 数 集 显 然 是 无 限 集 . 
集合 Z x W 显然 是 一 个 可 数 集 , 因为 它 是 两 个 可 数 集 ( 即 整数 集 与 正 整数 集 ) 的 第 
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射 不 一 定 是 映 上 的 . 因此 , Q 是 至 多 可 数 的 , 这 就 是 我 们 想 证 明 的 . 


卡 儿 乘 积 . 对 于 任意 一 个 给 定 的 有 理 数 x = p/g, 我 们 可 以 将 这 个 数 对 (p,q) 与 整数 
p 和 9 关联 起 来 , 其 中 g > 0. 这 样 就 得 到 了 一 对 一 映射 /: Q 一 Z x W, 但 这 个 映 


现在 停 下 来 思考 一 下 刚刚 证 明 的 神奇 结果 . 自然 数 集 与 有 理 数 集 之 间 存 在 着 一 


个 双 射 ! 于 是 , 我 们 可 以 把 有 理 数 集 写成 


Q = {gq1, g2, 93，… 上 上 


这 种 写法 既 没有 遗漏 


al 


任何 元 素 , 也 没有 重复 给 出 任何 元 素 ! 虽然 我 们 已 经 证 明了 存 


在 这 样 一 个 函数 , 但 这 并 不 意味 着 能 很 容易 地 把 它 写 下 来 (但 是 为 了 “好 玩 ”, 我 建 
议 你 找到 这 样 的 函数 ). 幸运 的 是 , 数学 中 有 很 多 这 样 的 例子 , 我 们 只 需要 知道 茶 物 


存在 或 可 以 完成 , 而 不 需要 弄 清楚 具体 做 法 ! 就 有 理 数 集 而 言 , 我 们 只 要 知道 它们 


可 以 “排序 ”就 足够 了 , 不 必 了 解 具体 次 序 是 什么 . 
既然 自然 数 集 、 整 数 集 和 有 理 数 集 都 是 可 数 集 , 那么 令 
4 = N, Z 或 Q, 我们 就 可 以 马上 得 到 下 面 的 结论 . 


E 论 C.2.3 


的 每 个 


推论 C.2.5 N", Zn 和 Q" 都 是 可 数 集 . 


这 个 结论 可 以 用 归纳 法 来 证 明 , 例如 , 把 Q"+1 写成 Q" x Q&. 
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回忆 一 下 , 我 们 说 过 如 果 一 个 集合 是 无 限 集 并 且 这 个 集合 与 有 理 数 集 


(或 者 整 


数 集 , 又 或 者 任意 一 个 可 数 集 ) 之 间 不 存在 双 射 , 那么 这 个 集合 就 是 不 可 数 集 . 我 们 


已 经 给 出 了 很 多 可 数 集 的 例子 , 除了 自然 数 集 、 整 数 集 和 有 到 


E 数 集 之 外 , 还 有 Q"， 


其 中 是 任意 正 整数 . 此 时 , 你 应 该 会 问 , 我 们 是 否 需要 不 可 数 这 个 词 . 毕 


疯 , 到 目 


前 为 止 , 我 们 见 到 的 所 有 集合 都 是 可 数 的 . 不 可 数 集 确 实 存在 , 这 正 是 我 们 接 下 来 


要 讲 的 . 


(yi)ien 构成 的 集合 , 其 中 y; € {0,1}, 那么 S 就 是 不 可 数 的 . 


定理 C.3.1 ( 康 托 尔 ) 实数 集 是 不 可 数 集 ， 这 是 因为 , 如 果 S 是 由 全 体 序列 


证 明 : ”我 们 来 证 明 从 序列 的 相关 陈述 中 如 何 推 导出 实数 集 是 不 可 数 的, 这 肯 


会 激发 你 阅读 技巧 | 


Se 


生 证 明 的 积极 性 . 考虑 区 间 [0,1] 中 十 进 制 展 


下 


1 组 成 的 所 有 数 . 在 民 的 这 个 子 集 和 集合 S 之 间 存 在 一 个 双 射 ,3 


式 完 全 由 0 和 


两 个 不 同 的 


展开 式 对 应 着 两 个 不 同 的 数 . 一 旦 确定 了 S 是 不 可 数 的 , 我 们 就 知道 RR 有 一 个 不 


可 数 子 集 , 那么 及 也 是 不 可 数 的 . 
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现在 只 需要 证 明 关 于 子 序列 的 陈述 . 我 们 利用 反 证 法 来 证 明 . 假设 存在 一 个 双 
射 f: S 一 N. 很 明显 , 这 相当 于 把 S 的 元 素 逐 个 列 出 来 : 
1 二 .YY11Y12713Y14 
Y2 二 .Y21422423Y24 
3 二 .X31T327T33T34 °° 
Tn 一 .YYmnlZn2Ymn3Yn4 nm 


注意 , 之 所 以 得 到 这 个 列表 


是 


(0i)ien ES, 其 中 0; = 1 vi. 


是 因 


因为 我 们 假设 S 是 个 可 数 集 ， 定 义 
注意 ， 0 不 可 能 含 


个 元 素 0 = 


在 上 面 的 列表 中 . 9 不 等 于 zw 


为 1 一 znn 关 YNw,; 我 们 迫使 6 与 zw 至 少 有 一 个 地 方 不 同 . 1 


该 把 5 中 的 全 体 元 素 都 列举 出 来 , 这 
上 述 证 明 是 由 康 托 尔 (1873 一 1874) 给 出 的 , 称 为 康 托 尔 对 角 论 证 . 
作为 一 个 不 错 的 练习 , 证 明 |[0,1]| = |R| = 


于 到 的 集合 . 


构成 的 集合 ， 


如 果 没有 提 到 咯 集 这 个 概念 
记 作 P(4). 如 果 4 是 包含 


, 就 说 明 我 们 玻 忽 了 . 4 的 寡 集 是 由 
n 个 元 素 的 有 限 身 


元 素 . 为 了 弄 清 楚 这 一 点 ， 
也 可 能 不 属于 . 注意 , 空 
那么 


P(4) = 


的 例子 中 , 由 0,1 组 成 的 全 体 可 数 序列 所 构成 的 集合 可 以 看 作 N 的 究 集 . 概 
自然 会 出 现 晕 集 . 不 幸 的 是 ， 


在 上 面 
率 中 


种 思 
完 集 g 和 4 都 是 4 的 宕 集 


就 导致 了 一 个 


矛 


RR*| = |C”|, 并 找到 


于 上 述 列 表 应 


秆 ! 


一 个 基数 严格 大 


A 的 全 体 子 集 


, 那么 P(4) 就 有 27 个 


路 是 要 注意 到 4 的 每 个 7 


c 素 可 能 属于 某 个 子 集 ， 


我 们 将 会 


集中 的 元 素 不 可 能 全 都 可 以 分 配 概率 . 


这 上 
根据 前 


通常 记 
beer on the wall...). I 


性 


of 


局 意味 着 ， 如 果 集 合 品 论 
连续 统 假设 , 这 些 公 到 


和 No( 发 音 为 aleph-naught, 并 
康 托 尔 对 角 
介 于 No 和 2xe 之 间 的 集合 ? 连续 统 假 i 
和 Paul Cohen 的 深入 研究 , 我 们 现在 知道 
的 其 他 公理 是 一 致 的 , 那么 无 论 我 们 肯定 连续 统 假设 ; 
都 仍然 成 立 ! 


{2, {a}, 


中 的 元 素 . 例如 , 如 果 4 = {a,5}，, 


{5}, {0,0}}. 


看 到 , 对 于 不 可 数 旨 


有 一 个 有 趣 的 问题 , 即 是 否 存在 一 个 大 小 严格 4 
面 的 讨论 , R 的 大 小 与 N, Z 或 Q 的 暴 集 的 大 小 是 一 样 


A( 比 如 [0,1]), 4 过 


介 于 纪 和 有 R 之 间 的 无 限 集 . 
的 . 有 理 数 集 的 大 小 


这 个 假设 与 


因 最 长 的 英文 歌 而 闻名 : Aleph-naught bottles 
论证 可 知 , No < 28o. 是 否 存 在 一 个 大 小 严格 
和 断言 不 存在 这 样 


的 集合 . 通过 Kurt Gadel 
集合 论 的 其 他 公理 无 关 . 这 
还 是 否定 
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所 以 , 现在 你 应 该 清楚 了 : 并 不 是 所 有 的 无 限 集 都 有 相同 的 大 小 , 其 中 既 有 可 


个 互 不 相交 的 子 集 , 即 有 


理 


数 集 又 有 不 可 数 集 . 最 后 给 出 一 点 说 明 , 考虑 单 


位 长 度 


E 数 构成 的 集合 与 无 理 


以 看 出 , 有 理 
点 来 量化 下 面 
数 的 概率 为 1! 


的 陈述 : 如 果 从 [0， 


子 集 是 可 数 的 , 而 无 理子 集 是 不 可 


数 的 . 在 C.4 节 中 , 我 介 
1] 中 均匀 地 取出 一 个 随机 数 , 那么 这 个 数 是 无 理 


数 构成 的 集合 . 从 上 面 


C.4 有理数 集 的 长 度 


现在 来 讨论 [0, 1 
b 一 a 是 很 自 


自然 的 . 我 们 把 这 个 


点 的 长 度 为 0. 那么 更 奇异 的 集合 呢 , 比如 有 
是 多 少 ? 测度 论 将 给 出 一 个 合理 的 解释 (参阅 [La2, Rud]), 这 旦 


内容 


冉 


显然 有 


上 述 等 式 之 所 以 成 立 , 就 是 因 
其 中 ze [0,1]. 
然而 , 它们 的 3 
最 后 , 如 果 4 c B, 那么 自 


可 数 个 互 不 相交 的 区 间 ,Cc [0,1] 的 并 . 因 


个 定义 意味 着 [a,5) 和 [a,0| 的 长 度 相等 . 


为 这 是 个 可 数 并 . 考虑 不 可 数 个 集合 五 = {x} 的 3 
由 于 每 个 单 点 集 {zx} 的 长 度 都 是 0, 我 们 认为 它们 并 的 长 度 也 是 0. 
是 [0,1], 其 长 度 为 1. 
然 有 |4|(4 的 长 度 ) 不 大 于 


理 数 集 和 无 到 


理子 得 


我 们 的 假设 意味 着 [0,1] 的 有 


为 1. 这 一 点 非常 重要 , 所 以 要 把 它 单独 列 | 


的 集合 的 概率 可 能 为 0”! 为 什么 
们 可 以 问 取出 
以 
0, 吏 可 以 将 其 解释 为 , 从 [0,1] 中 


J 长度 为 0, 所 以 
来 , 以 出 
用 概率 这 个 词 ? 当 


区 间 [0, 了 ]. 它 可 以 划分 成 两 
的 分 析 中 可 
] 将 利用 这 一 


子 集 的 大 小 . 把 区 间 了 = [a, 相 (或 者 [a,5) 等 ) 的 长 度 定义 为 
值 记 作 | 了 , 称 作 了 的 长 度 或 测度 . 这 个 定义 意味 着 a 
LE 数 集 ? 这 些 集合 的 测度 
有 只 引入 我 们 需要 的 


在 讨论 [0,1] 的 有 理子 集 的 长 度 或 大 小 之 前 , 我 们 先 做 一 些 准 备 工作 . 设 了 是 
此 , 如 果 n 关 m, 那么 II 是 个 空 集 . 


= Dn 


. 


BI(B 的 长 度 ). 注意 , 这 


0,1] 的 无 理子 集 的 长 度 
来 提醒 我 们 “有 无 穷 多 个 元 素 
考虑 [0,1] 上 的 均匀 分 布 时 , 我 
个 有 理 数 的 概率 是 多 少 . 答案 就 应 该 是 [0,1] 的 有 理子 集 的 长 度 除 


于 


定理 C.4.1 ”有理数 集 @ 的 长 度 为 0. 这 一 点 可 以 根据 [0,1] 的 有 理子 集 的 长 度 


为 0 来 得 到 . 


证 阴 框 架 : 
那么 


只 需要 证 明 8=QNn[0,1] 的 测度 为 0. 为 此 , 令 nrQ=QNn[n,ntl 


0,1] 的 长 度 (当然 , [0,1] 的 长 度 就 是 1). 如 果 证 明了 [0,1] 的 有 理子 集 的 长 度 是 
随机 取出 的 一 个 数 是 无 理 数 的 概率 为 1! 
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数 个 区 i 


集 的 长 度 会 始终 小 了 
的 长 度 不 为 0, 为 了 得 到 矛盾 , 我 们 只 需要 让 e 的 值 小 于 @ 长 度 的 一 半 . 


是 上 述 特 定性 质 . 


Q = [J+Q). 


n€EZ 


因为 每 个 n+ 的 长 度 都 与 8 相同 , 这 样 就 得 到 了 可 数 个 长 度 为 0 的 集合 的 并 , 所 
以 整个 有 理 数 集 的 长 度 为 0. 


为 了 证 明 |@| = 0, 我 们 要 证 明 , 对 于 任意 给 定 的 e > 0, 都 可 以 找到 一 个 由 可 


(1) |Q| C Un 
(2) nlln| < e. 


如 果 可 以 做 到 这 一 点 , 我 们 就 完成 了 证 明 . 为 什么 ? 这 意味 着 , [0, 1] 的 有 理子 


司 I 构成 的 外 


居 合 , 使 得 


6, 但 是 , 由 于 e 是 任 取 的 , 这 将 迫使 @ 的 长 度 等 于 0. 假设 


现在 , 问题 被 简化 成 了 证 明 存在 一 个 由 可 数 个 区 间 五 构成 的 集合 , 并 且 满 


因为 有 理 数 集 是 可 数 的 , 所 以 我 们 可 以 把 @ 的 元 素 列举 出 来 , 即 


Q = {zn}>%2_o. 对 于 每 一 个 n, 令 


这 相 


€ 
de 一 | n ;Tn + 
显然 8 C UnIn. 这 些 区间 不 一 定 是 互 不 相交 的 , 但 要 满足 


EF 就 完成 了 证 明 . 


€ 
2.27 


本 
4.2 


[UnTnl < nl 二 6， 
Nn 


现在 你 可 以 证 明 , 任何 一 个 可 数 集 的 测度 都 等 于 0. 


现在 是 时 候 看 一 看 我 们 对 无 限 集 的 直觉 是 如 何 被 误导 的 . 我 们 知道 无 穷 大 有 


不 同 的 层次 , 而 且 


C.5 ”上 康 托 尔 集 的 长 度 


可 数 集 的 元 素 比 不 可 数 集 少 . 我 们 刚刚 证 明了 任何 一 个 可 数 集 的 


长 度 都 是 0. 认为 所 有 不 可 数 集 都 有 正 的 长 度 应 该 是 合理 的 , 但 遗憾 的 是 并 非 如 此 ! 


Co 


康 托 尔 集 就 是 


口 


个 标准 例子 . 


康 托 尔 集 是 [0, 1] 的 一 个 神奇 子 集 . 我 们 要 分 阶段 构造 它 . 设 Co = [0,1]. 把 


C2 


PF 间 的 1/3 去 掉 ， 
并 (保留 所 有 端点 ). 为 了 构造 Co, 我 们 将 乘 


se eal, 


剩 下 的 部 分 是 C1 = [0,  U 四 ,本 注意 , C1 是 两 个 闭 区 间 的 
余 所 有 区 间 中 间 的 1/3 去 掉 , 从 而 得 到 


Pe 


把 这 个 过 程 不 断 持续 下 去 . 注意 , Cn 是 2 个 闭 区 间 的 并 , 每 个 区 间 的 长 度 都 是 


3-", 并 且 


Co D CI DC D 


定义 C.5.1 ( 康 托 尔 集 ) 康 托 尔 集 C 的 定义 为 


C= 门 Cn 二 {x ER 恨 : 对 于 任意 的 n, x € On}. 


| 


我 们 断言 康 托 尔 集 的 长 度 为 0. 对 于 每 一 个 n, 康 托 尔 集 包 含 在 2” 个 互 不 相交 
的 集合 的 并 中 , 其 中 每 个 集合 的 大 小 均 为 1/3". 因此 , 对 于 任意 的 mw 康 托 尔 集 的 长 
度 不 会 超过 (2/3)”. 当 n 取 任 意 大 的 值 时 , 不 难看 出 , 康 托 尔 集 的 长 度 是 0. 举 个 例 
子 , 假设 它 的 长 度 不 是 0. 为 了 明确 起 见 , 不 妨 设 康 托 尔 集 的 长 度 是 10-201. 我 们 
要 做 的 就 是 让 ” 取 足 够 大 的 值 , 从 而 使 (2/3)”< 10-201. 如 果 令 n> 11,500, 那么 
(2/3)”< 10-2001. 这 意味 着 , 大 小 为 10-2011 的 康 托 尔 集 是 一 个 长 度 小 于 10-2011 
的 集合 的 子 集 , 这 就 是 一 个 矛盾 . 
如 果 x 是 某 个 Cn 的 端点 , 那么 ze C. 起 初 , 人 们 可 能 认为 这 是 唯一 的 点 , 万 
其 是 因为 康 托 尔 集 的 长 度 为 0， 再 仔细 地 思考 一 下 , 你 可 以 证 明 和 3/4 也 属 
于 C, 但 它们 都 不 是 端点 . (提示 : 利用 归纳 法 . ) 为 了 从 Cn 中 构造 出 Chi, 我 
们 把 所 有 区 间 中 间 的 1/3 去 掉 . 对 于 每 一 个 子 区 间 , 剩 下 的 部 分 看 起 来 像 是 两 部 分 
的 并 , 并 且 每 一 部 分 的 长 度 都 是 上 一 个 区 间 的 1/3. 因此 , 我 们 得 到 了 可 以 固定 左 
右 部 分 的 映射 L, R : 及 一 及, 其 定义 为 L(z) = z/3 和 R(z) = (x 十 2)/3, 并 且 
Cn = RC) + LC,). 

我 们 可 以 证 明 , 康 托 尔 集 也 是 那些 三 进 制 展 开 式 中 没有 出 现 1 的 所 有 数 x € 
[0, 1] 的 集合 . 对 于 像 1/3 这 样 的 有 理 数 , 我 们 可 以 将 其 写成 重复 出 现 2 的 三 进 制 形 
式 : 1/3 = 0.02222 ... 如 果 考 虑 二 进 制 展开 式 , 你 可 以 证 明 存在 一 个 从 [0,1] 到 康 
托 尔 集 的 一 对 一 且 映 上 的 映射 当然 , 这 意味 着 康 托 尔 集 是 不 可 数 的 , 因为 在 它 和 
[0,1] 之 间 存 在 一 个 双 射 ! 

简单 地 概括 一 下 : 康 托 尔 集 是 不 可 数 集 , 它 与 [0,1| 中 的 元 素 存在 一 种 简单 的 
对 应 关系 , 但 长 度 是 0! 因此 ,“ 长 度 ” 概念 与 “基数 ”概念 不 同 : 两 个 集合 可 以 有 相 
同 的 基数 , 它们 的 长 度 却 可 能 非常 不 同 . 

关于 康 托 尔 集 的 更 多 内 容 , 包括 动力 学 解释 , 请 参阅 [Dev, Edg, Fal, SS3]. 


C.6 习 题 


习题 C.6.1 ”项 尔 伯 特 酒店 得 到 了 数学 家 的 精心 管理 . 酒店 里 有 无 穷 多 个 房间 , 即使 所 有 房 
间 都 被 占用 了 , 它 也 可 以 容纳 更 多 的 客人 , 而 且 不 需要 任何 客人 共享 房间 ! (a) 如 果 新 来 
了 一 位 客人 , 该 如 何 安 排 客 人 们 的 住宿 , 才能 把 一 间 房 腾 出 来 ?(5) 如 果 来 了 可 数位 新 客 


KK 
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人 , 该 如 何 安 3 
习题 C.6.2 证明 


90: B— A, 


非 客 人 们 的 住宿 , 才能 腾 出 足够 多 的 房间 ? 


j: 两 个 有 限 集 有 相同 的 基数 , 当 且 仅 当 它们 的 元 素 个 数 相 同 . 
习题 C.6.3 ”证 明 : 


设 4 和 B 是 两 个 集合 . 如 果 存 在 两 个 映 上 的 映射 x : 4 一 B 和 
E 么 14| =|BI. 


习题 C.6.4 如 果实 数 a 是 一 个 有 限 次 的 整 系数 多 项 式 的 根 , 则 称 a 是 代数 的 , 否则 称 a 是 


超越 的 . (a) 证 


明 : 全 体 有 理 数 都 是 代数 的 . (b) 证 明 : 所 有 平方 根 都 是 代数 的 . (c) 证 明 : 


所 有 代数 数 构成 的 集合 是 可 数 的 . (qd) 证 明 : 超越 数 构成 的 集合 是 不 可 数 的 . 


附录 D 复 分 析 与 中 心 极限 定理 


第 20 章 利用 


为 它 假设 了 一 些 来 自 复 分 析 的 结果 . 此 外 , 我 们 必须 假设 入 


生成 函数 证 明了 中 心 极限 定理 , 遗憾 的 是 这 个 证 明 并 不 完整 ， 


E 母 函数 是 存在 的 , 但 i 


迪 加 


一 点 并 不 总 是 成 立 . 
第 21 章 再 次 进行 了 尝试 , 并 利用 傅 里 叶 分 析 证 明了 中 心 极限 定理 . 这 一 次 我 


们 没有 使 用 可 能 不 存在 的 矩 母 函 数 , 而 是 利用 了 傅 里 叶 变 换 (也 称 为 特征 函数 ), 它 


有 非 第 好 且 有 用 的 存在 性 质 ! 不 入 的 是 , 这 里 也 要 利用 复 分 析 中 的 一 
这 让 我 们 陷入 了 困境 , 只 有 如 下 几 个 选择 


( 


直接 利用 复 分 析 中 的 一 些 结果 , 然后 继续 前 进 . 


1) 
(2) 尝试 寻找 为 一 种 不 需要 利用 复 分 析 的 证 明 . 
(3) 暂停 所 有 工作 , 快速 学 习 复 分 析 知 识 . 


本 章 适 合 那些 喜欢 第 三 种 选择 的 人 . 我 们 将 解释 复 分 析 中 的 一 些 关 键 思想 , 还 


要 特别 说 明 这 门 课 为 什么 与 实 分 析 如 此 不 同 . 显然 , 学 过 实 分 析 会 对 我 们 有 帮助 , 但 
级 数 以 及 收敛 性 的 基本 结果 , 那么 学 习 起 来 就 会 更 轻松 . 
事实 证 明 , 假设 一 个 实 变量 函数 是 可 微 的 并 没有 太 大 意义 , 但 假设 一 个 复 变量 
间 , 我 们 会 看 到 更 多 强大 的 事实 ， 显 然 ， 


是 如 果 你 熟悉 泰 昔 


函数 是 可 微 的 就 会 突然 为 我 们 开启 男 一 扇 


本 章 不 可 能 取代 整 门 课程 , 这 也 不 是 我 们 的 目标 . 我 们 想 展 示 这 个 美妙 主题 中 的 一 


些 关 键 思想 , 希望 当 你 读 完 之 后 能 更 好 地 理解 为 什么 复 分 析 中 的 黑 盒 结果 (定理 


20.5.3 和 20.5.4) 是 正确 的 . 


本 章 是 对 矩 母 函数 以 及 中 心 极限 定理 证 明 的 补充 . 因此 , 我 们 默认 读者 熟悉 第 
19 章 到 第 21 章 的 符号 和 概念 . 


D.1 来 自 实 分 析 的 警告 


肯定 会 比 你 想象 的 要 难 很 多 . 考虑 函数 g : 民 一 民 , 其 定义 为 


利用 导数 的 定义 以 及 洛 必 达 法 则 , 我 们 可 以 证 明 9 是 无 限 可 微 的 , 并 | 


ee 一 L/ 如 果 zz0 
4 . 其 他 . 


导数 在 原点 处 的 值 都 等 于 0. 例如 ， 


F 面 的 例子 是 我 最 喜欢 的 实 分 析 例子 之 一 . 它 说 明了 为 什么 实 分 析 很 难 , 而 且 几 乎 
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elL/ 0 
/ 1 
A 


加 
em 


= lim —= 
天 一 co ek? 


1 
ee 2Kem2 一 册 


最 后 一 步 用 到 了 洛 必 达 法 则 ( 即 如 果 limy_,w A(k) = limk BE) = co， 那么 
limnk oo A(R)/B(k) = limni eu 4k)/B'(k))，( 在 上 式 中 , 我 们 把 h 蔡 换 成 了 1/%， 
这 样 表 达 式 就 可 以 改写 成 我 们 熟悉 的 形式 , 进而 能 够 使 用 洛 必 达 法 则 . ) 同样 的 分 
析 表 明了 , 对 于 所 有 的 w 原点 处 的 n 阶 导数 都 等 于 0, 即 go(0) = 0, 其 中 n 是 任 
意 的 正 整 数 . 如 果 考 察 9 在 原点 处 的 泰勒 级 数 , 那么 有 


i x2 Ce (n) 
g(x) = OR A 到 (0) 


三 0: 


然而 , 当 xz 关 0 时 , 显然 有 9(z) 去 0. 于 是 , 现在 出 现 了 一 种 很 癌 雇 的 情况 , 即 泰 勒 
级 数 (对 所 有 的 x 均 收敛 ! ) 仅 在 x = 0 处 与 函数 保持 一 致 . 这 不 会 给 人 留 下 深刻 
的 印象 , 因为 泰勒 级 数 在 0 处 必须 与 原始 函数 一 致 , 因为 两 者 都 是 g(0). 

我 们 可 以 从 上 面 的 例子 中 学 到 很 多 .首先 , 泰勒 级 数 可 以 在 所 有 的 x 处 均 收 
敛 , 但 只 在 一 点 处 与 函数 相等 ! 仅 在 一 点 处 相等 并 不 让 人 感到 惊讶 , 因为 泰勒 级 数 
的 构造 过 程 要 求 它 必须 在 这 个 扩展 点 处 与 函数 一 致 . 其 次 , 更 为 重要 的 是 , 泰勒 级 
数 不 能 唯一 地 确定 函数 ! 例如 , snz 和 sinzx 十 g(x)( 其 中 g(x) 是 (D.1) 式 的 函数 ) 
在 z=0 处 有 相同 的 泰勒 级 数 . 

这 一 点 对 我 们 来 说 非常 重要 , 原因 是 我 们 想 知道 矩 母 函 数 什么 时 候 可 以 唯一 地 
确定 一 个 概率 分 布 . 如 果 分 布 是 离散 的 , 那 就 没什么 问题 了 (定理 19.6.5). 但 是 , 对 
于 连续 型 分 布 , 情况 要 难得 多 , 正如 我 们 在 (19.6.5) 式 中 所 看 到 的 , 两 个 概率 密度 函 
数 的 和 矩 是 相同 的 . 
显然 , 我 们 必须 对 连续 型 随机 变量 补充 一 些 附 加 条 件 . 对 于 离散 型 随机 变量 , 知 
道 所 有 和 矩 就 足够 了 , 不 过 这 对 连续 型 随机 变量 而 言 是 不 够 的 . 这 些 附加 条 件 应 该 是 
什么 呢 ? 
回顾 一 下 , 如 果 随 机 变量 X 的 概率 密度 函数 是 fx, 那么 它 的 天 阶 窍 ( 记 作 jy) 


ed 


二 二 区 (zjdz， 


我 们 重新 考虑 一 下 (19.6.5) 式 中 的 两 个 函数 . 一 个 很 好 的 微 积 分 练习 可 以 证 明 必 = 
ef 712. 这 意味 着 矩 母 函 数 是 


出 
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er /24k 


k=0 E k=0 


当 t 取 什 么 值 时 , 这 个 级 数 收 敛 ? 令 人 惊讶 的 是 , 这 个 级 数 仅 在 t = 0 时 收敛 ! 为 
了 弄 清 楚 这 一 点 , 只 需要 证 明 这 些 项 不 趋向 于 0 就 够 了 . 因为 ki < 入, 所 以 对 于 任 


意 一 个 固定 的 t, 当 足够 大 时 ， 


有 妈 /kl 之 (BR 另外 , e /2 二 (ex/2)*, 所 以 第 天 


项 至 少 与 (e*/2t/k)* 一 样 大 . 当 t 关 0 时 , 这 一 项 显然 不 趋向 于 0, 因此 和 拖 母 函数 的 


收敛 半径 是 0! 


这 让 我 们 有 了 下 列 猜 想 : 如 果 存 在 某 个 5 > 0, 使 得 当 |t| < 6 时 , 矩 母 函 数 收 


敛 , 那么 它 就 唯一 地 确定 了 概率 密度 函数 . 接 下 来 , 我 们 将 探讨 这 个 猜想 . 


也 .2 


复 分 析 与 拓扑 定义 


本 节 的 目的 是 让 你 了 解 , 为 
数 , 我 们 需要 给 出 什么 样 的 输入 . 
有 用 结果 . 


了 保证 和 抢 母 函数 可 以 唯一 地 确定 一 个 概率 密度 函 
我 们 先 给 出 一 些 定 义 , 然后 陈述 复 分 析 中 的 一 些 


定义 D.2.1 ( 复 变量 、 复 值 函数 ) 任意 一 个 复数 z 都 可 以 写成 z 二 x 十 iy, 其 中 
Zz 和 ?都 是 实数 , 且 i = V-1l. 我 们 把 复数 集 记 作 C. 复 值 函数 就 是 从 C 到 C 的 


映射 f, 换 句 话说 , f(z) EC. 通 


表示 虚 部 , 并 且 f(z) = v(x,y) 十 iv(x,y), 其 中 尺 .和 w 都 是 从 下? 到 下 的 函数 . 


常情 况 下 , 用 x = 只 (z) 来 表示 实 部 , 用 y = J(z) 


复数 的 写法 有 很 多 种 , 最 常见 的 是 上 面 的 定义 . 然而 , 极 坐 标 写 法 有 时 也 很 有 
是 


用 . 数学 中 最 显著 的 关系 之 一 


i0 


e 


二 cos0 ising. 


根据 你 对 数学 知识 的 掌握 程度 , 这 个 关系 式 可 以 从 多 个 角度 来 考察 . 一 种 方法 是 利 
用 指数 函数 、 正 弦 函 数 和 余弦 函数 的 泰勒 级 数 展开 式 . 这 给 出 了 另 一 种 书写 复数 的 
方法 , 1 十 i 可 以 写成 V2exp(ix/4). 一 个 特别 有 趣 的 选择 是 让 9 等 于 x, 这 样 就 得 
到 了 es = 一 1, 这 是 一 个 非常 漂亮 的 公式 , 包含 了 数学 中 最 重要 的 儿 个 常数 ! 


注意 , 忆 = 一 1. 不 难 证 明 ， 
(a 二 + 记 ) 二 (z+1 
(a ++ id): (zx1 


Zz 二 ZX 二 wy 的 共 斩 复 数 是 有 


Fiy) 一 (ae 二 2zZ) 二 iD 十 切 


Fiy) = (az — by) + i(ay 十 pz)， 


二 x 一 iy, z 的 绝对 值 ( 亦 称 模 或 大 小 ) 被 定义 为 V2z, 记 


作 |z|. 这 是 一 个 实数 , 它 等 于 Vx? 十 人 如 果 把 z 写成 一 个 向 量 , 那么 > = (zx,Y). 


注意 , 在 这 种 情况 下 , |z| 就 等 于 向 量 的 长 度 . 


704 ”附录 DD 复 分 析 与 中 心 极 限定 理 


我 们 儿 乎 可 以 把 任何 东西 写成 一 个 复 值 函数 , f(z) = 2 痉 十 |z| 就 是 这 样 一 个 函 
数 . 问题 是 这 种 函数 什么 时 候 关 于 > 可 微 ? 它 的 可 微 性 是 什么 ? 实际 上 , 在 回答 这 
个 问题 之 前 , 我 们 首先 要 陈述 复 值 函数 的 可 微 性 是 什么 意思 ! 


定义 D.2.2 (可 微 ) 如 果 一 个 复 值 函数 汪 关 于 复 变 量 z 可 微 , 即 


Jim f(zo+h)— f(z0) 
h—0 h 
存在 , 其 中 h 在 复 平 面 内 沿 着 任意 路 径 趋向 于 0, 那么 我 们 说 f 在 zo 处 是 ( 复 ) 
可 微 的 . 如 果 上 述 极 限 存在 , 我 们 就 把 这 个 极限 记 作 户 (z0). 如 果 了 是 可 微 的 , 那 
么 f(z 十 记 ) = v(x,y) 十 iv(7x,Vy) 满足 柯 西 - 黎 曼 方程 : 
Ou .Ov .Ou Ov 


1 
人 Bi. gh De 


(有 一 个 方向 很 容易 , 即 h 沿 着 路 径 及 和 讯 趋 向 于 0, 其 路 eRR). 


关于 为 什么 可 微 性 蕴含 着 柯 西 - 黎 曼 方程 这 里 有 一 个 简单 的 提示 一 一 试 着 把 
细 市 补充 完整 ,由 于 zo 处 的 导数 存在 , 所 以 上 述 重要 极限 与 我 们 到 达 zo 十 iyo 点 
的 路 径 无 关 . 考虑 路 径 2 十 20， 其 中 z 一 Xo, 以 及 路 径 zo LY， 嵌 中 y yo, 然后 
再 利用 多 元 微 积 分 关于 偏 导 数 的 结果 . 
我 们 进一步 探讨 , 看 看 哪些 函数 是 复 可 微 的 . 令 及 = 训 十 ihz, 其 中 一 0 十 0i. 
e 如 果 f(z) = z, 那么 


~ 


jim E+- 7 三 lim 忆 十 太一 和 
h—0 hh h—0 h—0 


因此 , 这 个 函数 是 复 可 微 的 , 且 导 数值 为 1. 
。 如果 f(z) = 22, 那么 


f(z+) -fs) _ (2+) 
h—0 h 和 h—0 h 
Zz 二 2zh+h?—2z2 
= lim 
h—0 h 
本 2zh+h2 
0 天 


= lim (2 十 几 ) 


= lim 2z+ limh 
h—0 h—0 


一 2z 十 0 三 2z. 
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我 们 利用 了 复数 的 下 列 性 质 : hh = 1 和 2zh 十 hh 二 (2z 十 h)h. 注意 这 与 实 
值 分 析 f(z) = zz 有 多 么 相似 . 
如 果 f(z) = z, 那么 


与 其 他 极限 不 同 , 这 个 极限 的 结果 不 能 马上 看 出 来 . 不 妨 设 > = x 十 iy 且 
hh 二 有 十 ih2( 当 然 , 且 =z 一 记 , 甩 = hi 一 ih2). 上 述 极 限 就 是 

h—0 hi +t ih2 kh;0 hi ih> 
这 个 极限 不 存在 . 当 h 沿 着 不 同 的 路 径 趋 向 于 0 时 , 我 们 会 得 到 不 同 的 答 
案 . 例如 , 如 果 hs = 0( 即 沿 着 x 轴 移 动 ), 那么 极限 就 是 limp_,o hi/hi = 1， 
日 如 果 hi = 0( 即 沿 着 y 轴 移 动 ), 那么 极限 就 是 limy_,0 一 ihz(/ih2) = 一 1. 
因此 , 虽然 这 是 一 个 相当 简单 的 函数 , 但 它 在 任何 地 方 都 不 是 复 可 微 的 . 


jt 


继续 沿 着 这 种 思路 进行 论证 , 我 们 会 发 现 , 如 果 z 和 yy 以 一 种 非常 特殊 的 形式 


呈现 , 即 每 一 项 都 是 关于 z = z 十 iy 的 函数 , 那么 这 个 函数 就 是 复 可 微 的 . 换 句 话 
说 , 函数 不 能 写成 关于 z = z 一 记 的 形式 . 如 果 函 数 可 以 同时 写成 这 两 种 形式 , 那 
么 zZ( 即 z 十 习 和 yy( 即 (z 一 习 / 就 能 被 分 离 出 来 . 我 们 开始 明白 了 为 什么 一 次 复 
可 微 就 意味 着 无 限 次 复 可 微 , 这 是 因为 函数 对 zx 和 y 的 依赖 非常 特殊 . 另外 , 在 直 
线 上 , 趋向 于 某 一 点 的 方法 只 有 两 种 : 从 上 方 或 从 下 方 . 在 复 平 面 上 , 情况 则 完全 不 
同 . 在 三 维 空间 中 , 移动 的 路 径 有 很 多 种 , 但 如 果 函 数 是 复 可 微 的 , 那么 每 条 路 径 都 
必须 给 出 相同 的 答案 . 这 就 是 为 什么 可 微 性 对 复 变量 的 意义 要 比 实 变量 大 得 多 


为 了 阔 述 所 需 的 复 分 析 结果 , 我 们 还 需要 引入 一 些 点 集 拓 扑 的 术语 . 特别 要 提 


到 , 下 面 的 很 多 定理 都 涉及 开 集 . 我 们 简单 地 回顾 相关 定义 并 给 出 一 些 例子 . 


定义 D.2.3 ( 开 集 , 闭 集 ) 设 U 是 C 的 一 个 子 集 . 如 果 对 于 任意 的 zo E U, 存 
在 一 个 6, 使 得 当 |z 一 zo| <6 时 ,有 zeEU( 注 意 , 6 可 以 依赖 于 z0), 那么 U 就 是 
一 个 开 集 . 如 果 集 合 C 的 补 集 C\ C 是 一 个 开 集 , 那么 C 就 是 一 个 闭 集 . 


下 面 给 出 C 中 一 些 开 集 的 例子 . 
(1) 对 于 任意 的 > 0, U1 = {z :|z| <7}. 这 个 集合 通常 称 为 以 原点 为 中 心 且 


半径 为 7 的 开 球 . 


(2) U2 = {z : R(z) > 0}. 为 了 看 出 这 是 一 个 开 集 , 考虑 如 果 zo € Uo, 那么 


20 二 Xo 十 iyo, 其 中 zo >0. 设 5= zo/2, 令 z=z 二 iy. 不 难看 出 , 如 果 |z 一 zo| < 05， 
那么 lz 一 zol < zo/2, 这 意味 着 x > zo/2 > 0. U2 通常 称 为 开 的 右 半 平面 . 
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对 于 闭 集 , 考虑 下 面 的 例子 . 

(1) G1 = {z :1z| 7}. 注意 , 如 果 wo 是 边界 上 的 任意 一 点 , 那么 以 zo 为 中 心 
且 半径 为 5 的 球 将 包含 与 原 点 的 距离 超过 7 的 点 , 因此 Oi 不 是 开 集 . 但 不 难 证 明 
Ci 是 个 闭 集 (事实 上 上 , C 被 称 为 以 原点 为 中 心 且 半径 为 > 的 闭 球 ). 我 们 来 证 明 它 
的 补 集 是 个 开 集 , 这 样 就 证 明了 C1 是 个 闭 集 . 现在 要 做 的 就 是 证 明 , 对 于 补 集中 
的 任意 一 点 , 存在 一 个 以 该 点 为 中 心 的 小 球 完全 包含 在 补 集 中 . 对 于 接 下 来 的 论述 ， 
我 建议 你 画 一 张 图 . 如 果 zsE CN\C 那么 |zo| > (否则 , zo 就 包含 在 C1 中 ). 令 
0 << oj , 通过 一 些 代数 运算 , 我 们 将 看 到 如 果 |z 一 | < 5, 那么 > E CN\C1. 因此 ， 
C\ C1 是 个 开 集 , 所 以 C1 是 闭 集 . 

(2) C2 = {z :RR(z) > 0}. 为 了 看 出 这 不 是 一 个 开 集 , 考虑 任意 一 点 2 = iy, 其 
中 ye€ 恨 . 采用 ] 与 U2 或 Oi 类 似 的 论述 ， 我 们 可 以 证 明 Cs 是 个 闭 集 . 
对 于 既 不 是 开 集 也 不 是 闭 集 的 集合 , 考虑 5 = Ui U C2. 
现在 我 们 来 陈述 复 值 函 数 的 两 个 最 重要 的 性 质 . 在 这 个 主题 中 , 最 1 
之 一 是 这 两 个 看 似 完全 不 同 的 性 质 其 实 是 等 价 的 ! 


定义 D.2.4 (全 纯 、 解析 ) 设 U 是 C 的 一 个 开 子 集 , 并 设 上 是 一 个 复 值 函数 . 
如 果 f 在 任意 一 点 z EU 处 都 可 微 , 就 说 了 在 U 上 是 全 纯 的 . 如 果 f 有 一 个 收 
0 并 且 该 级 数 展 开 式 与 f 在 U 上 的 值 一 致 , 那么 说 三 在 U 上 是 
解析 的 . 这 意味 着 , 对 于 任意 的 z0 E U, 当 z 接近 于 20 时 , 我 们 可 以 找到 an, 使 
得 


二 


要 的 结果 


正如 上 面 提 到 的 , 对 于 复 变量 函数 而 言 , 其 可 微 性 的 意义 远大 于 实 变量 函数 的 
可 微 性 . 下 面 的 定理 就 说 明了 这 一 点 . 
定理 D.2.5 设 上 是 一 个 复 值 函数 , U 是 一 个 开 集 . 那么 f 在 U 上 是 全 纯 的 ， 
当 且 仅 当 f 在 U 上 是 解析 的 , 并 且 f 的 级 数 展开 we， 
上 面 的 定理 很 惊人 , 其 结果 好 得 令 人 难以 置信 . 也 就 是 说 , 只 要 f 是 一 次 可 微 
的 , 它 就 是 无 限 ( 实 ) 可 微 的 , 并 且 /与 其 泰勒 级 数 展开 式 一 致 ! 这 与 实 变量 函数 的 
情况 有 很 大 不 同 . 例如 , 函数 


h(x) = Zasin(1/z) (D.2) 


在 z=0 处 只 能 一 次 可 微 , 但 (D.1) 式 的 函数 g(z) 却 是 无 限 可 微 的 , 并 且 其 泰勒 级 
数 展开 式 仅 在 =0 处 与 g(x) 一 致 . 复 分 析 与 实 分 析 真 的 是 截然 不 同 ! 
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接 下 来 的 定理 为 函数 何 时 恒 等 于 0 提供 了 一 个 非常 好 的 条 件 . 它 涉及 极限 点 


或 聚 点 的 概念 ; 我 们 先 给 出 这 些 定义 . 


定义 D.2.6 (极限 点 或 聚 点 ) 如 果 序列 {zujse 存在 一 个 收敛 到 > 的 子 列 
{znx}22o; 我 们 就 说 z 是 {z}2o 的 极限 点 (或 聚 点 ). 


我 们 通过 儿 个 例子 来 阐述 这 个 定义 . 
(1) 如 果 志 = 1/m 那么 0 就 是 一 个 极限 点 . 


(2) 如 果 z= cos(rm), 那么 它 有 两 个 极限 点 , 即 1 和 一 1. (如果 ,= cos(n)， 


那么 [1,1] 中 的 每 一 个 点 都 是 该 序列 的 极限 点 , 但 这 一 点 很 难 证 明 . ) 


(3) 如 果 = (1 十 (一 1)”)”* 十 1/n, 那么 0 是 一 个 极限 点 . 为 了 看 清 这 一 点 , 我 


们 可 以 取 子 列 {21,z3,z5,27,…); 注意 . 子 列 {20,z2,24,…} 将 发 散 到 无 穷 大 . 


(4) 设 z% 表示 的 不 同 素 因子 的 个 数 ， 那么 , 每 一 个 正 整数 都 是 该 序列 的 
极限 点 ! 例如 , 我 们 来 证 明 5 是 一 个 极限 点 ， 前 五 个 素数 是 2,3,5,7 和 11, 令 


N=2.3.5.7.11 = 2310， 考 虑 子 序列 {zw,zNz,ZN3,ZN4,"…}, 对 于 每 一 
N* 都 恰好 有 五 个 不 同 的 素 因 子 , 所 以 5 是 一 个 极限 点 . 

(5) 如 果 z= 72, 那么 该 序列 不 存在 极限 点 , 因为 lm ,。 2 = 00. 

(6) 设 wo 是 任意 一 个 正 奇数 , 并 且 令 


f+1 若 am 是 奇数 
eh 若 是 偶数 . 


人 们 猜测 1 始终 是 一 个 极限 点 (如 果 存 在 某 个 z, = 1, 那么 接 下 来 的 儿 项 一 定 
是 4,2,1,4,2,1,4,2,1,…， 因 此 这 个 序列 是 循环 的 )， 这 就 是 著名 的 3z + 1 问题 . 
Kakutani 认为 这 是 一 个 阻碍 美国 数学 发 展 的 阴谋 , 因为 人 们 花 在 这 上 面 的 时 间 太 
多 了 , Erd6s 认为 数学 还 没有 准备 好 回答 这 样 的 问题 . 对 这 个 问题 的 一 些 不 错 的 曾 
释 , 请 参阅 [Lagl,Lag2,Lag3], 但 要 小 心 , 这 个 问题 可 能 会 让 人 上 交 ! 

现在 阐述 下 面 这 个 定理 . 对 我 们 来 说 , 这 是 最 重要 的 复 分 析 结果 , 它 是 黑 盒 结 
果 的 基础 . 


定理 D.2.7 设 f 是 开 集 U 上 的 解析 函数 , 它 有 无 穷 多 个 零点 z1,z2,23,…， 如 
果 lim,, ,wo zn EU, 那么 了 在 U 上 恒 等 于 0. 换 名 话说, 如果 一 个 函数 在 U 中 某 
个 序列 上 始终 为 0, 并 且 该 序列 的 聚 点 也 包含 在 U 中 , 那么 这 个 函数 在 U 上 恒 
等 于 0. 


注意 , 上 述 内 容 与 在 实 分 析 中 的 情形 完全 不 同 . 重新 考虑 (D.2) 式 的 函数 


h(x) = zZ3sin(1/z). 


©O 
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这 个 函数 是 连续 可 微 的 . 对 于 整数 w 只 要 z = 1/(rm), 函数 值 就 等 于 0 如果 令 
zn 三 1/(rnm), 那么 0 就 是 这 个 序列 的 极限 点 , 并 且 该 函数 在 0 处 的 值 也 是 0( 参 见 
D-1). 然而 , 这 个 函数 显然 不 恒 等 于 0. 我 们 再 次 看 到 , 实 值 函 数 与 复 值 函数 之 
间 存 在 着 明显 的 区 别 . 作为 一 个 很 好 的 练习 , 证 明 za sin(1/z) 不 是 复 可 微 的 . 回顾 
ei 二 cos0 十 isin0 或 sin0 == (ei 一 e-8)/2 应 该 会 对 你 有 帮助 . 


[Ill 1 人 | | | 

[I A 

| AAA TH | 
yy 


.03 


图 D-1 zasin(1/z) 的 图 形 
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我 们 通过 陈述 几 个 非常 有 用 的 事实 来 结束 技术 0 < 
将 会 用 到 拉 普 拉 斯 变换 的 性 质 , 拉 普 拉 斯 变换 的 定义 为 (L 有 )(s) = /0 ez 
当 回 顾 和 矩 母 函数 的 定义 时 , 拉 普 拉 斯 变换 在 理论 A 
显 了 . 如 果 随 机 变量 X 的 概率 密度 函数 为 f, 那么 X 的 矩 母 函数 就 是 


Mx(t) = Ele:X] = Ls ef(z)dzx 


换 名 话说 , 矩 母 函数 就 是 概率 密度 函数 在 s = -时 的 拉 普 拉 斯 变换 . 
还 记得 , 如 果 Fx 和 Gy 分 别 是 随机 变量 X 和 了 的 累积 分 布 函数 , 并 且 X 和 
Y 的 概率 密度 函数 分 别 是 f 和 g, 那么 


Sy 


我 们 曾 假定 了 两 个 重要 结果 (定理 20.5.3 和 定理 20.5.4), 接 下 来 将 重申 这 两 个 定 
理 . 在 给 出 其 内 容 后 , 我 们 会 讨论 它们 的 证 明 . 
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定理 D.3.1 ”假设 矩 母 函数 Mx(t) 和 My(t) 在 0 的 菜 个 邻 域内 存在 ( 即 存在 
某 个 6, 使 得 当 |t| < 5 时 , 这 两 个 函数 均 存 在 ) 如 果 Mx(t) = My(t) 在 这 个 邻 
域内 恒 成 立 , 那么 Fx(w) = Fy (uw) 对 所 有 的 wu 均 成 立 . 因为 概率 密度 函数 是 累 
积分 布 通 数 的 导数 , 所 以 了 = g. 

定理 D.3.2 设 {Xijier 是 一 列 随 机 变量 , 它们 的 矩 母 函 数 是 Mx,(t). 假设 存在 
一 个 6 > 0, 使 得 当 |t| < 6 时 , lim;_,wo Mx,(t) = Mx(t), 其 中 Mx (zx) 是 一 个 矩 母 
函数 , 并 且 当 |t| < 6 时 , 所 有 的 矩 母 函 数 都 收敛 . 那么 , 存在 唯一 的 累积 分 布 函 数 
王 ) 其 矩 由 Mx(t) 给 出 .对 于 Fx(z) 的 所 有 连续 点 , 均 有 limni ,wo Fx,(7) = Fx(z)， 


对 这 些 定 理 的 证 明 需 要 利用 复 分 析 的 结果 , 尤其 是 拉 普 拉 斯 公式 和 传 里 叶 反 演 
公式 . 为 了 举例 说 明 如 何 利用 复 分 析 的 结果 来 证 明 这 些 结论 , 我 们 给 出 下 一 个 定理 
证 明 的 大 部 分 细 市 . 我 们 故意 不 尽 可 能 一 般 化 地 证 明 下 面 的 结果 ! 


定理 D.3.3 设 铸 和 YY 是 两 个 定义 在 [0,co) 上 的 连续 型 随机 变量 , 它们 的 概 
率 密 度 函 数 分 别 是 连续 函数 f 和 g, 并 且 两 者 的 所 有 适 都 有 限 且 相 等 . 另外 , 假 
设 如 下 两 点 . 
(1) 存在 某 个 C > 0, 使 得 当 c < C 时 , e(c+Dtf(et) 与 ec+btg(eb 都 是 施 瓦 
效 函 数 (参见 定义 21.1.3). 这 不 是 一 个 非常 严格 的 假设 . 为 了 保证 所 有 的 
和 矩 都 存在 且 有 限 , f 和 g 必须 衰减 . 由 于 我 们 要 计算 f 和 0 在 et 处 的 值 ， 
而 不 是 在 t 处 的 值 , 所 以 这 里 会 出 现 巨大 的 衰减 . 这 个 假设 的 关键 在 于 了 
和 g 都 是 无 限 可 微 的 , 并 且 它 们 的 导数 是 衰减 的 . 
(2) 撼 (不 一 定 是 整数 阶 ) 


a 的 语 [ zrnjlzldz 和 以 全 = | arnrg(zjdz 


与 某 个 非 负 实数 列 frnjseu 一 致 , 并 且 该 序列 存在 一 个 有 限 的 聚 点 ( 即 
lim os Ta 00)s 


那么 f= g( 换 名 话说 , 知道 所 有 和 矩 可 以 唯一 确定 概率 密度 函数 ). 


证 明 : ”我 们 给 出 证 明 的 框架 , 这 个 过 程 有 些 长 而 且 需 要 些 技巧 . 记 住 , 这 个 证 
明 是 为 了 强调 我 们 所 需 的 复 分 析 结 果 为 什么 成 立 ， 你 可 以 快速 浏览 或 跳 过 这 个 证 
明 , 但 是 建议 你 阅读 本 市 末尾 的 例子 , 在 那里 我 们 将 重新 见 到 让 人 头疼 的 两 种 概率 


注意 , 对 于 任意 一 个 具有 非 负 实 部 的 > A(z) 均 存 在 . 为 了 弄 清 楚 这 一 点 , 设 8(z) 
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表示 z 的 实 部 , 并 让 有 表示 满足 k < 8(z) < 十 1 的 唯一 非 负 整数 . 那么 z98z < 


日 
Ma]l < 人 rR Fz)| + lg) az 


< tor)flodet | +t)glo)de = 2ph + 2 
0 0 


现在 , 由 分 析 学 结果 可 知 , 4A(z) 对 所 有 的 z 均 存在 . 关键 在 于 4 也 是 可 微 的 . 交换 
求 导 与 求 积 分 的 次 序 (我 们 可 以 证 明 其 合理 性 , 参阅 定理 B.2.2), 我 们 得 到 了 


A’'(z) = 大 xX” (log zw)h(z)dz. 


为 了 证 明 4A'(z) 的 存在 性 , 只 需要 证 明 这 个 积分 是 有 定义 的 . 这 个 积分 只 有 两 个 潜 
和 , 即 z 一 co 和 zz 一 0 的 情形 . 当 z 较 大 时 , zzlogz < z+1, 那么 hh 的 
快速 衰减 将 给 出 | (logz)h(z)dz| < eco. 当 zz 在 0 附近 取 值 时 , h(x) 看 起 来 很 
像 是 h(0) 加 上 一 个 小 的 误差 项 ~ 我 们 假设 f 和 g 是 连续 的 ); 因此 , 存在 一 个 
C, 使 得 当 |z| < 1 时 , |h(z)| < C. 注意 ， 


1 


lim . x*(log rw)h(z)dz 
0 


< 一 0 .| < 


1 
< im1 / 1:(—logx):Cdzx. 


logz 的 原 函 数 是 zlogz 一 zz, 并且 lime_yo(eloge 一 e) = 0. 这 足以 证 明 上 述 积 4 
有 界 的 , 那么 由 分 析 学 结果 可 知 , 4'(z) 存在 . 

我 们 (终于 ! ) 可 以 使 用 复 分 析 的 结果 了 . 因为 4 一 次 可 微 , 所 以 它 是 无 限 可 
微 的 . 另外 , 对 于 所 有 满足 只 (2 > 0 的 z, 4(z) 均 与 其 泰勒 级 数 相等 . 因此, 4 是 
一 个 解析 函数 , 并 且 在 一 个 有 聚 点 的 序列 z,, 上 等 于 0, 所 以 4 恒 等 于 0. 这 个 结果 
很 惊人 - 最 初 , 我 们 只 知道 当 z 是 一 个 正 整数 或 者 z 属于 序列 {7,} 时 , 4(z) 为 0; 
现在 , 我 们 知道 对 于 所 有 满足 R(z) > 0 的 z, 4(z) 都 为 0. 这 个 非凡 的 结论 来 自 于 
复 分 析 , 我 们 正 是 在 这 里 使 用 了 它 . 

现在 做 变量 蔡 换 , 把 z 替换 成 et, 并 把 dz 替换 成 eidt. 此 时 的 积分 区 域 就 变 
成 了 从 -co 到 co, 并 设 b(t)dt = h(e!)etdt. 于 是 有 


二 < 


A(z) = 人 etzb(bdt = 0. 


根据 我 们 的 假设 , 令 z = c+ 2riy, 其 中 ec 小 于 C, 那么 


4(c+2riy) = / e2™ty [ectp(t)| dt = 0. 
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由 假设 可 知 , etp(t) 是 一 个 施 瓦 兹 函数 , 因此 它 有 唯一 的 傅 里 时 逆 变 换 . 我 们 知道 
这 个 变换 等 于 0, 所 以 etp(t) = 0, 即 h(x) = 0, 也 就 是 f(x) = g(x). 

我 们 最 后 分 析 了 侍 里 叶 首 变换, 因为 我 们 的 目标 是 证 明 f(x) = g(x), 而 不 是 
A(z) = 0. 如 果 没 有 f = g, 那么 4A(z) 恒 等 于 0 看 起 来 就 很 荒 雇 , 但 我 们 必须 严格 
地 证 明 这 一 点 . 
如 果 减 少 对 f 和 9g 的 限制 呢 , 比如 其 中 一 个 不 是 连续 函数 ?或 者 像 上 一 个 定 
里 那 样 , 对 于 一 列 给 定 的 矩 , 存在 唯一 一 个 连续 的 概率 分 布 与 之 对 应 , 但 是 如 果 允 
许 不 连续 的 分 布 , 就 可 能 导致 其 他 的 可 能 性 . 这 个 话题 超出 了 本 书 的 范围 , 我 们 需 
要 更 高 等 的 分 析 学 结果 . 但 是 , 我 们 想 指 出 哪里 可 能 存在 危险 , 哪里 需要 小 心 . 

在 证 明了 定理 D.3.3 之 后 , 我 们 自然 要 回 过 头 来 看 看 引起 这 么 多 麻烦 的 两 个 概 
率 密度 函数 , 即 (参见 (19.2) 式 ) 

fo(x) = f(x) [1 + sin(27 10g 7)|. 


我 们 知道 这 两 个 概率 密度 函数 有 相同 的 整数 阶 矩 (它们 的 阶 矩 都 是 e* 2, 其 中 
k 是 一 个 非 负 整 数 ). 这 些 函 数 有 很 好 的 衰减 性 , 注意 ， 


壤 


ett fp (et) 一 e(c+l)t . eH/2 
V2net 

的 衰减 速度 足以 使 任何 ec 满足 定理 D.3.3 的 假设 . 因为 这 两 个 概率 密度 函数 不 相 
等 ,所 以 一 定 有 某 个 条 件 无 法 满足 ， 唯 一 需要 验证 的 条 件 是 , 是 否 存在 一 个 数列 
{frnajs2 ou, 其 聚 点 为 > > 0 并 且 使 得 x, 阶 窍 相等 . 利用 更 多 的 复 分 析 结 果 (特别 是 
围 道 积分 ), 我 们 可 以 算出 (a 十 避 ) 阶 算 . 现在 有 


万 的 (e+ 动 ) 阶 矩 是 e(o+ib) /2 


并 且 


及 的 全 十 击 阶 拭 是 Be 12 下 (ee alcHoh) 1 
当 5 = 0 且 a 是 一 个 正 整 数 时 , 这 些 矩 是 相等 的 , 但 我 们 找 不 到 一 列 存在 聚 点 的 
实数 矩 , 使 得 两 个 函数 在 该 序列 上 有 相等 的 矩 . 为 了 弄 清楚 这 一 点 , 注意 到 当 b= 0 
时 , 户 的 a 阶 条 是 


eo /2 站 @(0—2in)? /2 (1 本 ed4on) ， (D.3) 


而 这 个 值 不 可 能 为 0, 除非 a 是 一 个 半 整 数 ( 即 a = k/2, 其 中 是 整数 ). 事实 上 ， 
我 们 把 (D.3) 式 写 成 上 述 形式 就 是 为 了 强调 , 当 a 是 半 整 数 时 , 结果 只 能 是 0. 实数 
与 复数 的 指数 函数 不 可 能 等 于 0, 所 以 这 个 结果 只 有 在 1 = eer 时 才 等 于 0. 回顾 


卫 
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一 下 ew 二 cos9 十 isin9, 不 难看 出 , a 阶 宅 为 0 等 价 于 1 一 cos(4na) 一 ;isin(4ra) = 0. 
实现 这 一 点 的 唯一 方法 是 让 a = k/2, 其 中 是 整数 .在 这 种 情况 下 , 余弦 项 为 1 
日 正 弱项 为 0. 


D.4 习 题 


习题 D.4.1 当 z 关 0 时 , 令 f(x) = zasin(1/z); 当 z =0 时, j0) = 0. (a) 证 明 : 当 把 了 
看 作 实 变量 函数 时 , f 是 一 次 可 微 的 , 但 f 三 次 不 可 微 . (b) 证 明 : 当 把 f 看 作 关 于 复 变 
量 z 的 函数 时 , 了 是 不 可 微 的 . 注意 到 sinw = (ez 一 e ”)/2i 可 能 会 有 些 帮 助 . 

习题 D.4.2 ”已 知 f 的 所 有 秆 都 是 有 限 的 ， f 是 无 限 可 微 的 , 那么 是 否 一 定 存在 某 个 C， 

使 得 当 c < C 时, e(%+Dtf(e!) 是 一 个 施 瓦 效 函 数 ? 
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